실시간 화자식별을 위한 UBM 클러스터링 기반 고속 Likelihood 계산 = UBM clustering based fast likelihood computation for real-time speaker identification

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 247
  • Download : 0
Gaussian Mixture Model(GMM)은 여러 분류, 인식 분야에서 전통적으로 널리 사용되는 통계적인 모델이다. 최근에 여러 분야에서 분류기와 인식기의 성능을 향상시키기 위해 neural network, SVM과 같은 여러 알고리즘에 대한 연구와 아이디어가 제안되고 있다. 이러한 흐름에도 GMM은 아직 그 자체가 가진 여러 장점들과, 통계적인 특성들로 인하여 가장 널리 사용되고 있는 방법이다. GMM기반의 화자 식별 분야는 일반적으로 많은 계산 복잡도를 요하는 분야로서 이때 계산 복잡도는 테스트 발화의 길이, 등록 화자의 수, GMM의 크기에 비례하는 관계를 가진다. 화자 식별 기술을 실제 적용분야에 사용되기 위해서는 대개 많은 계산 복잡도를 획기적으로 줄이는 것이 관건이지만 계산 복잡도와 식별 성능은 일반적으로 trade-off관계가 성립한다. 따라서 계산 복잡도를 감소시키기 위해서는 식별성능의 저하를 감수해야 하는데 이전의 연구들에서 눈에 띄는 식별성능의 저하 없이 계산 복잡도를 줄이기 위한 시도가 활발히 있어 왔다. 대표적으로 테스트 특징 벡터열의 길이를 줄이는 pre-quantization(PQ)과 현저히 likelihood 값이 낮은 화자모델을 계산과정에서 제외시키는 speaker pruning기법이 있다. 본 논문에서는 UBM 클러스터링 기반의 Gaussian pruning기법을 소개하여 GMM의 사이즈에 해당하는 계산 복잡도 문제를 완화시키는 방법을 제안하였다. 이 알고리즘을 통해 실험을 수행한 결과 미미한 정도의 식별성능 저하에서 6 speed-up factor를 얻었고 결론적으로 이는 제안한 방법이 실제 시스템 환경에서 실시간 처리를 위하여 효과적으로 적용될 수 있음을 보여준다.
Advisors
김회린researcherKim, Hoi-Rin
Description
한국과학기술원 : 전기및전자공학과,
Publisher
한국과학기술원
Issue Date
2014
Identifier
569239/325007  / 020123291
Language
kor
Description

학위논문(석사) - 한국과학기술원 : 전기및전자공학과, 2014.2, [ vi, 45 p. ]

Keywords

화자 식별; computational complexity; UBM clustering; GMM; speaker identification; 계산 복잡도; GMM; UBM 클러스터링

URI
http://hdl.handle.net/10203/196767
Link
http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=569239&flag=dissertation
Appears in Collection
EE-Theses_Master(석사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0