음소별 성조 정보를 이용한 신경망 기반의 한국어 음소 지속시간 모델링A Neural Network Based Korean Segmental Duration Modeling Using Tonal Information of Phonemes

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 611
  • Download : 1
음소별 지속시간의 정확한 예측은 TTS 시스템의 자연성을 향상시키는데 중요한 역할을 한다. 기존의 한국어 음소 지속 시간의 모델링을 위해 사용된 특징 변수에는 음소 문맥 정보, 품사 정보, 운율구 내에서의 위치 정보 등이 있다. 본 논문에서는 음소별 성조 정보 값을 새로운 특징 변수로 정의하여 에측 성능을 향상시키고자 한다. 성조 정보의 표현을 위해 두 개의 비경제 성조와 여섯 개의 경계 성조를 정의한 후, 400문장의 음성 코퍼스에 음절별 표기를 수행하였다. 성조 정보를 이용한 지속 시간 예측을 위햐, 출력노드에서 음소의 지속 시간을 실수 형태로 출력하는 신경망을 구성하고, 이를 오류 역전파 알고리즘으로 학습시켰다. 실험 결과, 성조 정보를 사용하는 경우 실험 데이터에 대해 예측값과 실제값 사이의 상관계수로 0.863을 얻을 수 있었으며 이는 성조를 사용하지 않는 경우에 비해 향상된 성능을 나타내었다.
Publisher
한국음향학회
Issue Date
1999-08
Language
Korean
Citation

한국음향학회지, v.18, no.6, pp.84 - 88

ISSN
1225-4428
URI
http://hdl.handle.net/10203/17659
Appears in Collection
CS-Journal Papers(저널논문)
Files in This Item

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0