Kernel PCA 를 통한 GMM 기반의 음성 변환GMM based voice conversion using kernel PCA

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 820
  • Download : 0
DC FieldValueLanguage
dc.contributor.advisor오영환-
dc.contributor.advisorOh, Yung-Hwan-
dc.contributor.author한준희-
dc.contributor.authorHan, Joon-Hee-
dc.date.accessioned2011-12-13T06:08:13Z-
dc.date.available2011-12-13T06:08:13Z-
dc.date.issued2009-
dc.identifier.urihttp://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=308913&flag=dissertation-
dc.identifier.urihttp://hdl.handle.net/10203/34871-
dc.description학위논문(석사) - 한국과학기술원 : 전산학전공, 2009.2, [ iv, 30 p. ]-
dc.description.abstract이 논문은 가우시안 혼합 모델 (GMM)을 기반으로 한 새로운 음성변환 시스템에 대해 설명한다. 가우시안 혼합 모델을 통한 음성 변환 시스템은 태생적인 문제점을 가지고 있는데, 그것은 음색을 표현하는 스펙트럼 포락(spectral envelope)이 과도하게 부드러워진다는 것이다. 이러한 문제 때문에 발생하는 음성 변환 품질의 저하를 보상하는 것이 이 논문의 목적이다. 성능향상을 위해 커널을 통한 주성분 분석 기법(Kernel PCA) 를 사용하여 얻을 수 있는 장점을 이용하였다. 커널을 통한 주성분 분석 기법의 주요 특징으로는 데이터의 분포를 새로운 모양으로 변형시키는 점과 데이터 차원 수를 임의의 차원으로 바꿀 수 있다는 점이 있다. 먼저, 데이터 재분포의 특성을 이용하여 입력공간(input space)에 존재하는 원시화자의 음성 데이터를 특징공간(feature space)로 옮겨 새로운 모양의 분포를 도출하였다. 새롭게 변형된 분포는 가우시안 혼합 모델에 적합하도록 모양이 바뀌게 되었다. 가우시안 혼합 모델을 이용한 모델링 성능 향상과 관련된 것으로 원시화자의 데이터와 목적화자의 데이터 간의 매핑관계가 있다. 커널을 통한 주성분 분석 기법의 차원 확장 특징을 이용하면 두 화자 데이터 간의 매핑을 정교하게 할 수 있다. 결국, 정교해진 매핑 관계를 바탕으로 음성 변환 품질이 향상된다. 제안된 기법은 음성 데이터의 분포와 차원 수를 모두 변화시킨다. 하지만 목적화자의 데이터는 입력 공간에 존재해야 하므로 본 논문에서는 원시화자의 데이터만 변화시켰다. 실험 결과를 살펴보면 제안된 기법이 기존의 가우시안 혼합 모델을 이용한 음성 변환 시스템보다 여러 가지 실험 환경에서 높은 성능을 보여주었다.kor
dc.languagekor-
dc.publisher한국과학기술원-
dc.subjectVoice conversion-
dc.subjectKernel PCA-
dc.subjectGMM-
dc.subjectGaussian Mixture Model-
dc.subjectKernel Principal Component Analysis-
dc.subject음성 변환-
dc.subject커널 피씨에이-
dc.subject가우시안 믹스쳐 모델-
dc.subject가우시안 혼합 모델-
dc.subject커널 주성분 분석-
dc.subjectVoice conversion-
dc.subjectKernel PCA-
dc.subjectGMM-
dc.subjectGaussian Mixture Model-
dc.subjectKernel Principal Component Analysis-
dc.subject음성 변환-
dc.subject커널 피씨에이-
dc.subject가우시안 믹스쳐 모델-
dc.subject가우시안 혼합 모델-
dc.subject커널 주성분 분석-
dc.titleKernel PCA 를 통한 GMM 기반의 음성 변환-
dc.title.alternativeGMM based voice conversion using kernel PCA-
dc.typeThesis(Master)-
dc.identifier.CNRN308913/325007 -
dc.description.department한국과학기술원 : 전산학전공, -
dc.identifier.uid020073620-
dc.contributor.localauthor오영환-
dc.contributor.localauthorOh, Yung-Hwan-
Appears in Collection
CS-Theses_Master(석사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0