DSpace at KOASAS: 음향 인텐시티를 사용한 심층신경망 기반 엔드투엔드 다채널 음성 잔향 제거 기법

DSpace at KOASAS

College of Engineering(공과대학)School of Electrical Engineering(전기및전자공학부)EE-Theses_Master(석사논문)

음향 인텐시티를 사용한 심층신경망 기반 엔드투엔드 다채널 음성 잔향 제거 기법End-to-end multichannel speech dereverberation using acoustic intensity based on deep neural networks

Cited 0 time in webofscience

Cited 0 time in scopus

Hit : 146
Download : 0

Export

정경석

객체 기반 오디오 시스템은 마이크로폰 어레이로 녹음된 신호에서 개별 음원에 대한 정보와 공간 정보를 분리하여 저장한 후, 렌더링 시에 현장과 유사하게 음장을 재현하는 시스템이다. 이를 구현하기 위해선 녹음된 신호로부터 잔향을 제거할 필요가 있다. 최근 심층신경망을 이용해 다채널 신호를 입력으로 받아 잔향을 제거하는 기법이 좋은 성능을 보이나, 크기 스펙트로그램만을 다루기에 왜곡된 위상으로 인해 복원한 신호의 품질이 떨어지는 단점이 있다. 본 연구에서는 그러한 문제를 완화하고자 시간 영역의 방향 특징을 입력으로 하는 엔드투엔드 모델을 사용할 것을 제안한다. 방향 특징은 삼차원 음향 인텐시티의 근사값으로 잔향의 양이나 직접파와 반사파의 방향을 판단하는 데에 유용한 정보이다. 훈련에 사용한 모델은 변형을 통해 보다 효율적인 학습을 가능케 하였으며 기존 모델 및 기법들과 비교하여 우수한 성능을 보임을 확인하였다.

Advisors: 최정우 researcher; Choi, Jung Woo researcher

Description: 한국과학기술원 :전기및전자공학부,

Publisher: 한국과학기술원

Issue Date: 2020

Identifier: 325007

Language: kor

Description: 학위논문(석사) - 한국과학기술원 : 전기및전자공학부, 2020.8,[iv, 60 p. :]

Keywords: 잔향 제거▼a심층신경망▼a음향 인텐시티▼a시간 영역 특징; Dereverberation▼aDeep Neural Networks▼aAcoustic Intensity▼aTime-domain Feature

URI: http://hdl.handle.net/10203/285048

Link: http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=925212&flag=dissertation

Appears in Collection: EE-Theses_Master(석사논문)

Files in This Item: There are no files associated with this item.

Display Full Item Record

qr_code

트윗하기

KOASAS

Knowledge Service Development Team, KAIST 291 Daehak-ro, Yuseong-gu, Daejeon 34141, Republic of Korea. T. 82-42-350-4493 Email. koasas@kaist.ac.kr
Copyright © 2016. Korea Advanced Institute of Science and Technology. All Rights Reserved.

KOASAS

KOASAS

Browse

음향 인텐시티를 사용한 심층신경망 기반 엔드투엔드 다채널 음성 잔향 제거 기법End-to-end multichannel speech dereverberation using acoustic intensity based on deep neural networks

KOASAS

Communities & Collections