확률적 슬롯 검출 및 n-gram 유사도 측정법을 이용한 음소 기반 음성 검색Phone-based speech search using probabilistic slot detection and n-gram similarity measure

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 688
  • Download : 0
컴퓨팅 파워의 증가와 저장 장치의 발달로 인터넷상에는 대용량의 멀티미디어(오디오 및 비디오)자료가 생산되고 있다. 수작업에 의한 색인방법은 그 한계가 존재하므로 자동화할 수 있는 음성 문서 검색(spoken document retrieval: SDR) 기술은 점점 더 핵심 응용 분야로 떠오르고 있으며, 이에 대한 연구가 활발히 진행되고 있다. SDR은 색인 단위에 따라 대규모 연속 음성 인식기(large vocabulary continuous speech recognition: LVCSR)를 이용한 워드 단위 방법과 음소 인식기를 이용한 서브워드 단위 방법으로 구분할 수 있다. LVCSR 시스템을 사용하면 높은 인식 성능을 얻을 수 있지만 미등록 어휘(out of vocabulary: OOV)에 대해서는 인식 성능이 하락하는 문제가 존재한다. 대신 음소 인식기를 이용하면 이 문제를 해결할 수 있다. 하지만 음소 인식기는 LVCSR 시스템에 비해 인식 성능이 높지 않기 때문에 오류를 고려한 검색 기법이 필요하다. 본 논문에서는 음소 인식기의 낮은 인식률을 극복하기 위해 확률적 슬롯 검출방법과 n-gram기반의 유사도 측정법을 제안한다. 실험 결과 제안된 시스템의 검색 정확도가 9.25% 향상되면서 검색 속도 또한 1.7배 빨라지는 것으로 나타났다.
Advisors
오영환researcherOh, Yung-Hwanresearcher
Description
한국과학기술원 : 전산학전공,
Publisher
한국과학기술원
Issue Date
2009
Identifier
308899/325007  / 020073391
Language
kor
Description

학위논문(석사) - 한국과학기술원 : 전산학전공, 2009.2, [ v, 33 p. ]

Keywords

Spoken Document Retrieval; Probabilistic Slot Detection; N-gram Similarity Measure; 음성 문서 검색; 확률적 슬롯 검출; n-gram 유사도 측정; Spoken Document Retrieval; Probabilistic Slot Detection; N-gram Similarity Measure; 음성 문서 검색; 확률적 슬롯 검출; n-gram 유사도 측정

URI
http://hdl.handle.net/10203/34857
Link
http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=308899&flag=dissertation
Appears in Collection
CS-Theses_Master(석사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0