DC Field | Value | Language |
---|---|---|
dc.contributor.author | 김미혜 | ko |
dc.contributor.author | 김용기 | ko |
dc.contributor.author | 임종관 | ko |
dc.date.accessioned | 2016-11-09T02:54:50Z | - |
dc.date.available | 2016-11-09T02:54:50Z | - |
dc.date.created | 2016-10-13 | - |
dc.date.created | 2016-10-13 | - |
dc.date.issued | 2016-08 | - |
dc.identifier.citation | 디지털융복합연구, v.14, no.8, pp.233 - 243 | - |
dc.identifier.issn | 1738-1916 | - |
dc.identifier.uri | http://hdl.handle.net/10203/213586 | - |
dc.description.abstract | 소음환경에서의 음성인식 문제점으로 인해 1990년대 중반부터 음성정보와 영상정보를 결합한 AVSR(Audio Visual Speech Recognition) 시스템이 제안되었고, Lip Reading은 AVSR 시스템에서 시각적 특징으로 사용되었다. 본 연구는 효율적인 AVSR 시스템을 구축하기 위해 입 모양만을 이용한 발화 단어 인식률을 극대화하는데 목적이 있다. 본 연구에서는 입 모양 인식을 위해 실험단어를 발화한 입력 영상으로부터 영상의 전처리 과정을 수행하고 입술 영역을 검출 한다. 이후 DNN(Deep Neural Network)의 일종인 CNN(Convolution Neural Network)을 이용하여 발화구간을 검출하고, 동일한 네트워크를 사용하여 입 모양 특징 벡터를 추출하여 HMM(Hidden Markov Model)으로 인식 실험을 진행하였다. 그 결과 발화구간 검출 결과는 91%의 인식률을 보임으로써 Threshold를 이용한 방법에 비해 높은 성능을 나타냈다. 또한 입모양 인식 실험에서 화자종속 실험은 88.5%, 화자 독립 실험은 80.2%로 이전 연구들에 비해 높은 결과를 보였다. | - |
dc.language | Korean | - |
dc.publisher | 한국디지털정책학회 | - |
dc.title | 발화구간 검출을 위해 학습된 CNN 기반입 모양 인식 방법 | - |
dc.title.alternative | Lip Reading Method Using CNN for Utterance Period Detection | - |
dc.type | Article | - |
dc.type.rims | ART | - |
dc.citation.volume | 14 | - |
dc.citation.issue | 8 | - |
dc.citation.beginningpage | 233 | - |
dc.citation.endingpage | 243 | - |
dc.citation.publicationname | 디지털융복합연구 | - |
dc.identifier.doi | 10.14400/JDC.2016.14.8.233 | - |
dc.identifier.kciid | ART002140554 | - |
dc.contributor.localauthor | 김미혜 | - |
dc.contributor.nonIdAuthor | 김용기 | - |
dc.contributor.nonIdAuthor | 임종관 | - |
dc.subject.keywordAuthor | Image Processing | - |
dc.subject.keywordAuthor | AVSR | - |
dc.subject.keywordAuthor | Lip Reading | - |
dc.subject.keywordAuthor | Motion Segmentation | - |
dc.subject.keywordAuthor | DNN | - |
dc.subject.keywordAuthor | 이미지 프로세싱 | - |
dc.subject.keywordAuthor | 시청각음성인식 | - |
dc.subject.keywordAuthor | 입모양 인식 | - |
dc.subject.keywordAuthor | 발화구간검출 | - |
dc.subject.keywordAuthor | 심화신경망 | - |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.