DSpace at KOASAS: 종단간 음성인식기를 위한 준교사 학습 방식의 도메인 적응

DSpace at KOASAS

College of Engineering(공과대학)School of Electrical Engineering(전기및전자공학부)EE-Theses_Master(석사논문)

종단간 음성인식기를 위한 준교사 학습 방식의 도메인 적응Semi-supervised domain adaptation for end-to-end automatic speech recognition

Cited 0 time in webofscience

Cited 0 time in scopus

Hit : 156
Download : 0

Export

정현재

최근 신경망 기반 심층학습 알고리즘의 적용으로 고전적인 GMM-HMM 음성인식기에 비해 성능이 비약적으로 향상되었다. 또한 심층학습 기법의 장점을 더욱 잘 활용하는 방법으로 언어모델링 및 디코딩 과정을 통합처리 하는 종단간 음성인식 시스템에 대한 연구가 매우 활발히 진행되고 있다. 일반적으로 종단간 음성인식 시스템은 어텐션을 사용한 여러 층의 인코더-디코더 구조로 이루어져 있다. 때문에 종단간 음성인식 시스템이 충분히 좋은 성능을 내기 위해서는 많은 양의 음성과 문자열이 함께 있는 데이터가 필요하다. 음성-문자열 짝 데이터를 구하기 위해서는 사람의 노동력과 시간이 많이 필요하고, 종단간 음성인식기를 구축하는 데 있어서 높은 장벽이 되고 있다. 그렇기에 비교적 적은 양의 음성-문자열 짝 데이터를 이용하여 종단간 음성인식기의 성능을 향상하는 선행연구들이 있으나, 음성 단일 데이터나 문자열 단일 데이터 한쪽만을 활용하여 진행된 연구가 대부분이다. 본 연구에서는 음성 또는 문자열 단일 데이터를 함께 이용하여 종단간 음성인식기가 다른 도메인의 말뭉치에서도 좋은 성능을 낼 수 있도록 하는 준교사 학습 방식을 제안했으며, 성격이 다른 도메인에 적응하여 제안된 방식이 효과적으로 동작하는지 확인하였다. 그 결과로 제안된 방식이 타깃 도메인에서 좋은 성능을 보임과 동시에 소스 도메인에서도 크게 열화 되지 않는 성능을 보임을 알 수 있었다.

Advisors: 김회린 researcher; Kim, Hoirin researcher

Description: 한국과학기술원 :전기및전자공학부,

Publisher: 한국과학기술원

Issue Date: 2020

Identifier: 325007

Language: kor

Description: 학위논문(석사) - 한국과학기술원 : 전기및전자공학부, 2020.2,[iii, 31 p. :]

Keywords: 음성인식▼a종단간▼a준교사 학습▼a도메인 적응▼a심층 학습; Automatic Speech Recognition▼aEnd-to-End▼aSemi-Supervised▼aDomain Adaptation▼aDeep Learning

URI: http://hdl.handle.net/10203/284773

Link: http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=911403&flag=dissertation

Appears in Collection: EE-Theses_Master(석사논문)

Files in This Item: There are no files associated with this item.

Display Full Item Record

qr_code

트윗하기

KOASAS

Knowledge Service Development Team, KAIST 291 Daehak-ro, Yuseong-gu, Daejeon 34141, Republic of Korea. T. 82-42-350-4493 Email. koasas@kaist.ac.kr
Copyright © 2016. Korea Advanced Institute of Science and Technology. All Rights Reserved.

KOASAS

KOASAS

Browse

종단간 음성인식기를 위한 준교사 학습 방식의 도메인 적응Semi-supervised domain adaptation for end-to-end automatic speech recognition

KOASAS

Communities & Collections