DSpace at KOASAS: Kernel PCA 를 통한 GMM 기반의 음성 변환

DSpace at KOASAS

College of Engineering(공과대학)School of Computing(전산학부)CS-Theses_Master(석사논문)

Kernel PCA 를 통한 GMM 기반의 음성 변환GMM based voice conversion using kernel PCA

Cited 0 time in webofscience

Cited 0 time in scopus

Hit : 820
Download : 0

Export

DC Field	Value	Language
dc.contributor.advisor	오영환	-
dc.contributor.advisor	Oh, Yung-Hwan	-
dc.contributor.author	한준희	-
dc.contributor.author	Han, Joon-Hee	-
dc.date.accessioned	2011-12-13T06:08:13Z	-
dc.date.available	2011-12-13T06:08:13Z	-
dc.date.issued	2009	-
dc.identifier.uri	http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=308913&flag=dissertation	-
dc.identifier.uri	http://hdl.handle.net/10203/34871	-
dc.description	학위논문(석사) - 한국과학기술원 : 전산학전공, 2009.2, [ iv, 30 p. ]	-
dc.description.abstract	이 논문은 가우시안 혼합 모델 (GMM)을 기반으로 한 새로운 음성변환 시스템에 대해 설명한다. 가우시안 혼합 모델을 통한 음성 변환 시스템은 태생적인 문제점을 가지고 있는데, 그것은 음색을 표현하는 스펙트럼 포락(spectral envelope)이 과도하게 부드러워진다는 것이다. 이러한 문제 때문에 발생하는 음성 변환 품질의 저하를 보상하는 것이 이 논문의 목적이다. 성능향상을 위해 커널을 통한 주성분 분석 기법(Kernel PCA) 를 사용하여 얻을 수 있는 장점을 이용하였다. 커널을 통한 주성분 분석 기법의 주요 특징으로는 데이터의 분포를 새로운 모양으로 변형시키는 점과 데이터 차원 수를 임의의 차원으로 바꿀 수 있다는 점이 있다. 먼저, 데이터 재분포의 특성을 이용하여 입력공간(input space)에 존재하는 원시화자의 음성 데이터를 특징공간(feature space)로 옮겨 새로운 모양의 분포를 도출하였다. 새롭게 변형된 분포는 가우시안 혼합 모델에 적합하도록 모양이 바뀌게 되었다. 가우시안 혼합 모델을 이용한 모델링 성능 향상과 관련된 것으로 원시화자의 데이터와 목적화자의 데이터 간의 매핑관계가 있다. 커널을 통한 주성분 분석 기법의 차원 확장 특징을 이용하면 두 화자 데이터 간의 매핑을 정교하게 할 수 있다. 결국, 정교해진 매핑 관계를 바탕으로 음성 변환 품질이 향상된다. 제안된 기법은 음성 데이터의 분포와 차원 수를 모두 변화시킨다. 하지만 목적화자의 데이터는 입력 공간에 존재해야 하므로 본 논문에서는 원시화자의 데이터만 변화시켰다. 실험 결과를 살펴보면 제안된 기법이 기존의 가우시안 혼합 모델을 이용한 음성 변환 시스템보다 여러 가지 실험 환경에서 높은 성능을 보여주었다.	kor
dc.language	kor	-
dc.publisher	한국과학기술원	-
dc.subject	Voice conversion	-
dc.subject	Kernel PCA	-
dc.subject	GMM	-
dc.subject	Gaussian Mixture Model	-
dc.subject	Kernel Principal Component Analysis	-
dc.subject	음성 변환	-
dc.subject	커널 피씨에이	-
dc.subject	가우시안 믹스쳐 모델	-
dc.subject	가우시안 혼합 모델	-
dc.subject	커널 주성분 분석	-
dc.subject	Voice conversion	-
dc.subject	Kernel PCA	-
dc.subject	GMM	-
dc.subject	Gaussian Mixture Model	-
dc.subject	Kernel Principal Component Analysis	-
dc.subject	음성 변환	-
dc.subject	커널 피씨에이	-
dc.subject	가우시안 믹스쳐 모델	-
dc.subject	가우시안 혼합 모델	-
dc.subject	커널 주성분 분석	-
dc.title	Kernel PCA 를 통한 GMM 기반의 음성 변환	-
dc.title.alternative	GMM based voice conversion using kernel PCA	-
dc.type	Thesis(Master)	-
dc.identifier.CNRN	308913/325007	-
dc.description.department	한국과학기술원 : 전산학전공,	-
dc.identifier.uid	020073620	-
dc.contributor.localauthor	오영환	-
dc.contributor.localauthor	Oh, Yung-Hwan	-

Appears in Collection: CS-Theses_Master(석사논문)

Files in This Item: There are no files associated with this item.

Display Simple Item Record

qr_code

트윗하기

KOASAS

Knowledge Service Development Team, KAIST 291 Daehak-ro, Yuseong-gu, Daejeon 34141, Republic of Korea. T. 82-42-350-4493 Email. koasas@kaist.ac.kr
Copyright © 2016. Korea Advanced Institute of Science and Technology. All Rights Reserved.

KOASAS

KOASAS

Browse

Kernel PCA 를 통한 GMM 기반의 음성 변환GMM based voice conversion using kernel PCA

KOASAS

Communities & Collections