조음 기관 모델링을 통한 한국어 모음 음성 합성기 구현Implementation of articulatory speech synthesizer for Korean vowel

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 1129
  • Download : 0
음성합성 분야는 기계와 사람간의 정보 전달의 한 부분으로, 음성 장애인의 보조 시스템, 다양한 정보 안내/소개 시스템, TTS 시스템, 휴머노이드 로봇 등에 응용할 수 있는 분야이다. 음성 합성을 구현하는 방법에는 여러가지가 있는데, 그 중 포만트 합성법과 연결형 합성법이 현재 많이 이용되고 있는 방식이다. 이 방식들은 현재 좋은 음질의 결과를 보이고 있으나, 기본적으로 사람의 실제 말소리 데이터 베이스를 바탕으로 이루어져서 다양한 음색과 어휘구현에는 제한이 따르게 된다. 바로 이러한 문제점을 극복할 수 있는 방식이 조음 음성 합성법 (articulatory speech synthesis)이다. 이론적으로는 조음 음성 합성법이 사람의 말소리를 가장 잘 흉내낼 수 있다고 알려져 있다. 조음 음성 합성법은 사람의 조음기관을 모델링해서 말소리 합성을 하기때문에, 다양한 음색과 어휘 구현이 가능한 무한한 잠재력을 지니고 있다. 그러나, 조음 음성 합성법은 구현 과정의 복잡함과 많은 계산량으로 인해 지금까지 많은 시도가 있지 않았다. 그래서, 이 논문 연구에서는 국내에서는 처음으로 한국어 모음과 연결음 등의 말소리를 낼 수 있는 조음 음성 합성법을 실제로 구현하였다. 한국인의 모음 발성 MRI 자료를 이용해서 조음 기관의 위치와 단면적을 처음으로 추출하였고, Mermelstein의 성도 모델을 기반으로 Kelly-Lochbaum 필터를 응용하였다. 그리고, 다양한 음색과 길이, 억양 등의 구현이 시도 되었고 결과를 제시하였다.
Advisors
정명진researcherChung, Myung-Jinresearcher
Description
한국과학기술원 : 전기및전자공학전공,
Publisher
한국과학기술원
Issue Date
2002
Identifier
174084/325007 / 020003455
Language
kor
Description

학위논문(석사) - 한국과학기술원 : 전기및전자공학전공, 2002.2, [ vii, 103 p. ]

Keywords

한국어 모음 단면적; 성도 디지털 필터; 성도 모델링; 조음 음성 합성기; 한국어 단모음 MRI 자료; Positions of articulator; Cross-sectional areas; Kelly-Lochbaum digital filter; Mermelstein``s vocal tract model; Articulatory speech synthesis

URI
http://hdl.handle.net/10203/37554
Link
http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=174084&flag=dissertation
Appears in Collection
EE-Theses_Master(석사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0