DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | 김회린 | - |
dc.contributor.advisor | Kim, Hoirin | - |
dc.contributor.author | 정현재 | - |
dc.date.accessioned | 2021-05-13T19:34:15Z | - |
dc.date.available | 2021-05-13T19:34:15Z | - |
dc.date.issued | 2020 | - |
dc.identifier.uri | http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=911403&flag=dissertation | en_US |
dc.identifier.uri | http://hdl.handle.net/10203/284773 | - |
dc.description | 학위논문(석사) - 한국과학기술원 : 전기및전자공학부, 2020.2,[iii, 31 p. :] | - |
dc.description.abstract | 최근 신경망 기반 심층학습 알고리즘의 적용으로 고전적인 GMM-HMM 음성인식기에 비해 성능이 비약적으로 향상되었다. 또한 심층학습 기법의 장점을 더욱 잘 활용하는 방법으로 언어모델링 및 디코딩 과정을 통합처리 하는 종단간 음성인식 시스템에 대한 연구가 매우 활발히 진행되고 있다. 일반적으로 종단간 음성인식 시스템은 어텐션을 사용한 여러 층의 인코더-디코더 구조로 이루어져 있다. 때문에 종단간 음성인식 시스템이 충분히 좋은 성능을 내기 위해서는 많은 양의 음성과 문자열이 함께 있는 데이터가 필요하다. 음성-문자열 짝 데이터를 구하기 위해서는 사람의 노동력과 시간이 많이 필요하고, 종단간 음성인식기를 구축하는 데 있어서 높은 장벽이 되고 있다. 그렇기에 비교적 적은 양의 음성-문자열 짝 데이터를 이용하여 종단간 음성인식기의 성능을 향상하는 선행연구들이 있으나, 음성 단일 데이터나 문자열 단일 데이터 한쪽만을 활용하여 진행된 연구가 대부분이다. 본 연구에서는 음성 또는 문자열 단일 데이터를 함께 이용하여 종단간 음성인식기가 다른 도메인의 말뭉치에서도 좋은 성능을 낼 수 있도록 하는 준교사 학습 방식을 제안했으며, 성격이 다른 도메인에 적응하여 제안된 방식이 효과적으로 동작하는지 확인하였다. 그 결과로 제안된 방식이 타깃 도메인에서 좋은 성능을 보임과 동시에 소스 도메인에서도 크게 열화 되지 않는 성능을 보임을 알 수 있었다. | - |
dc.language | kor | - |
dc.publisher | 한국과학기술원 | - |
dc.subject | 음성인식▼a종단간▼a준교사 학습▼a도메인 적응▼a심층 학습 | - |
dc.subject | Automatic Speech Recognition▼aEnd-to-End▼aSemi-Supervised▼aDomain Adaptation▼aDeep Learning | - |
dc.title | 종단간 음성인식기를 위한 준교사 학습 방식의 도메인 적응 | - |
dc.title.alternative | Semi-supervised domain adaptation for end-to-end automatic speech recognition | - |
dc.type | Thesis(Master) | - |
dc.identifier.CNRN | 325007 | - |
dc.description.department | 한국과학기술원 :전기및전자공학부, | - |
dc.contributor.alternativeauthor | Jeong, Hyeonjae | - |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.