음색변환과 음성DNA를 이용한 음성합성 기술 및 장치APPARATUS AND METHOD FOR SPEECH SYNTHESIS USING VOICE COLOR CONVERSION AND SPEECH DNA CODES

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 230
  • Download : 0
본 발명은 자동음성합성에서 음성합성 장치를 구성하는 기준화자의 음성모델을 사용자의 음성데이터로부터 추출한 음성DNA 정보를 사용하여 특정 또는 가상의 목적화자의 음색을 나타내는 목적화자 음성모델로 음색변환하여 목적화자의 음성을 파형으로 합성하는 음성합성 장치 및 방법이 개시된다. 일 실시예에 따른 음성합성 장치는 기준화자 음색의 음성합성을 위한 음성모델에 임의의 화자들로부터 수집된 음성데이터를 활용하는 화자적응 기법을 적용하여 특정화자 음성모델로 변환하는 음색변환기, 상기 음색변환기를 사용하여 특정화자의 음색을 나타내도록 음성모델을 변환시키는 음색변환정보나 변환된 특정화자 음성모델을 음성DNA 정보로 부호화하는 음성DNA 부호화기, 복수의 특정 화자들의 음성DNA 정보를 적합한 비율로 서로 재조합하여 가상의 목표화자에 대한 음성DNA 정보를 합성하는 음성DNA 재조합기, 상기 음성DNA 부호화기나 상기 음성DNA 재조합기를 사용하여 구해진 음성DNA 정보를 복호화하는 음성DNA 복호화기, 상기 음성DNA 복호화기를 사용하여 복원된 목표화자의 음색변환정보를 활용하여 상기 기준화자 음성모델로부터 목표화자 음성모델을 생성하는 목표화자 음성모델 생성기, 상기 음성DNA 복호화기나 상기 목표화자 음성모델 생성기를 사용하여 복원된 목표화자 음성모델을 적용하여 입력된 임의의 텍스트에 해당하는 음성파형을 합성하는 음성합성기를 포함할 수 있다.
Assignee
한국과학기술원
Country
KO (South Korea)
Issue Date
2016-10-06
Application Date
2015-08-20
Application Number
10-2015-0117530
Registration Date
2016-10-06
Registration Number
10-1665882-0000
URI
http://hdl.handle.net/10203/230428
Appears in Collection
EE-Patent(특허)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0