음향 인텐시티를 사용한 심층신경망 기반 엔드투엔드 다채널 음성 잔향 제거 기법End-to-end multichannel speech dereverberation using acoustic intensity based on deep neural networks

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 138
  • Download : 0
객체 기반 오디오 시스템은 마이크로폰 어레이로 녹음된 신호에서 개별 음원에 대한 정보와 공간 정보를 분리하여 저장한 후, 렌더링 시에 현장과 유사하게 음장을 재현하는 시스템이다. 이를 구현하기 위해선 녹음된 신호로부터 잔향을 제거할 필요가 있다. 최근 심층신경망을 이용해 다채널 신호를 입력으로 받아 잔향을 제거하는 기법이 좋은 성능을 보이나, 크기 스펙트로그램만을 다루기에 왜곡된 위상으로 인해 복원한 신호의 품질이 떨어지는 단점이 있다. 본 연구에서는 그러한 문제를 완화하고자 시간 영역의 방향 특징을 입력으로 하는 엔드투엔드 모델을 사용할 것을 제안한다. 방향 특징은 삼차원 음향 인텐시티의 근사값으로 잔향의 양이나 직접파와 반사파의 방향을 판단하는 데에 유용한 정보이다. 훈련에 사용한 모델은 변형을 통해 보다 효율적인 학습을 가능케 하였으며 기존 모델 및 기법들과 비교하여 우수한 성능을 보임을 확인하였다.
Advisors
최정우researcherChoi, Jung Wooresearcher
Description
한국과학기술원 :전기및전자공학부,
Publisher
한국과학기술원
Issue Date
2020
Identifier
325007
Language
kor
Description

학위논문(석사) - 한국과학기술원 : 전기및전자공학부, 2020.8,[iv, 60 p. :]

Keywords

잔향 제거▼a심층신경망▼a음향 인텐시티▼a시간 영역 특징; Dereverberation▼aDeep Neural Networks▼aAcoustic Intensity▼aTime-domain Feature

URI
http://hdl.handle.net/10203/285048
Link
http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=925212&flag=dissertation
Appears in Collection
EE-Theses_Master(석사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0