CNN 기반 관계 추출 모델의 성능 향상을 위한 다중-어의 단어 임베딩 적용 Multi-sense Word Embedding to Improve Performance of a CNN-based Relation Extraction Model

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 119
  • Download : 0
관계 추출이란 문장 내 두 개체간의 관계를 분류하는 것으로, 많은 연구들이 관계추출 모델을 설계함에 있어 원격 지도학습 방식을 이용하고 있다. 그리고 최근 딥러닝의 발전으로 다양한 연구에서 관계 추출 모델 설계 시 CNN 또는 RNN 등의 딥러닝 모델을 적용하는 것이 주요 흐름으로 발전하고 있다. 그러나 기존 연구들에서는 모델 학습의 입력으로 사용되는 단어 임베딩의 동형이의어 문제를 해결하지 않았다는 단점이 있다. 따라서 서로 다른 의미를 가진 동형이의어가 하나의 임베딩 값으로 모델 학습이 진행되고, 그에 따라 단어의 의미를 정확히 파악하지 못한 채 관계 추출 모델을 학습한다고 볼 수 있다. 본 연구에서는 다중-어의 단어 임베딩을 적용한 관계 추출 모델을 제안한다. 다중-어의 단어 임베딩 학습을 위해 CoreNet Concept 기반의 어의 중의성 해소 모듈을 활용하였고, 관계추출 모델은 문장 내 주요 키워드를 스스로 학습하는 CNN 모델과 PCNN 모델 2가지를 활용하였다.
Publisher
한국정보과학회
Issue Date
2018-08
Language
Korean
Keywords

distant supervision; relation extraction; word embedding; convolutional neural network; 원격 지도학습; 관계추출; 단어 임베딩; 합성곱 신경망

Citation

정보과학회논문지, v.45, no.8, pp.816 - 824

ISSN
2383-630X
URI
http://hdl.handle.net/10203/246939
Appears in Collection
CS-Journal Papers(저널논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0