Kernel PCA 를 통한 GMM 기반의 음성 변환 = GMM based voice conversion using kernel PCA

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 600
  • Download : 0
이 논문은 가우시안 혼합 모델 (GMM)을 기반으로 한 새로운 음성변환 시스템에 대해 설명한다. 가우시안 혼합 모델을 통한 음성 변환 시스템은 태생적인 문제점을 가지고 있는데, 그것은 음색을 표현하는 스펙트럼 포락(spectral envelope)이 과도하게 부드러워진다는 것이다. 이러한 문제 때문에 발생하는 음성 변환 품질의 저하를 보상하는 것이 이 논문의 목적이다. 성능향상을 위해 커널을 통한 주성분 분석 기법(Kernel PCA) 를 사용하여 얻을 수 있는 장점을 이용하였다. 커널을 통한 주성분 분석 기법의 주요 특징으로는 데이터의 분포를 새로운 모양으로 변형시키는 점과 데이터 차원 수를 임의의 차원으로 바꿀 수 있다는 점이 있다. 먼저, 데이터 재분포의 특성을 이용하여 입력공간(input space)에 존재하는 원시화자의 음성 데이터를 특징공간(feature space)로 옮겨 새로운 모양의 분포를 도출하였다. 새롭게 변형된 분포는 가우시안 혼합 모델에 적합하도록 모양이 바뀌게 되었다. 가우시안 혼합 모델을 이용한 모델링 성능 향상과 관련된 것으로 원시화자의 데이터와 목적화자의 데이터 간의 매핑관계가 있다. 커널을 통한 주성분 분석 기법의 차원 확장 특징을 이용하면 두 화자 데이터 간의 매핑을 정교하게 할 수 있다. 결국, 정교해진 매핑 관계를 바탕으로 음성 변환 품질이 향상된다. 제안된 기법은 음성 데이터의 분포와 차원 수를 모두 변화시킨다. 하지만 목적화자의 데이터는 입력 공간에 존재해야 하므로 본 논문에서는 원시화자의 데이터만 변화시켰다. 실험 결과를 살펴보면 제안된 기법이 기존의 가우시안 혼합 모델을 이용한 음성 변환 시스템보다 여러 가지 실험 환경에서 높은 성능을 보여주었다.
Advisors
오영환researcherOh, Yung-Hwanresearcher
Description
한국과학기술원 : 전산학전공,
Publisher
한국과학기술원
Issue Date
2009
Identifier
308913/325007  / 020073620
Language
kor
Description

학위논문(석사) - 한국과학기술원 : 전산학전공, 2009.2, [ iv, 30 p. ]

Keywords

Voice conversion; Kernel PCA; GMM; Gaussian Mixture Model; Kernel Principal Component Analysis; 음성 변환; 커널 피씨에이; 가우시안 믹스쳐 모델; 가우시안 혼합 모델; 커널 주성분 분석; Voice conversion; Kernel PCA; GMM; Gaussian Mixture Model; Kernel Principal Component Analysis; 음성 변환; 커널 피씨에이; 가우시안 믹스쳐 모델; 가우시안 혼합 모델; 커널 주성분 분석

URI
http://hdl.handle.net/10203/34871
Link
http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=308913&flag=dissertation
Appears in Collection
CS-Theses_Master(석사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0