전문분야 사전과 코퍼스 및 외래어 인식에 기반한 전문용어 추출Automatic extraction of technical terminologies based on a dictionary, a corpus in a specific field, detection of a transliterated foreign word

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 610
  • Download : 0
전문용어란 특정 분야의 개념의 언어적 표현을 말한다. 특정 분야의 기술 발달은 새로운 개념을 지칭하는 새로운 전문용어를 생성한다. 대부분의 이러한 전문용어는 사전에 등재되어 있지 않으며, 형태소 분석기나 정보검색 시스템과 같은 자연언어처리 시스템의 오류를 발생시킨다. 따라서 전문용어를 처리하는 효과적인 자연언어처리 시스템을 구축하기 위해서는 전문용어를 추출하는 작업이 필요하다. 본 논문은 전문분야 코퍼스와 사전 그리고 외래어의 자동 인식에 기반한 전문용어 추출 기법을 제안하고자 한다. 빈도수와 같은 통계정보나 언어정보만을 사용한 기존 연구와는 달리 본 논문에서는 통계정보, 외래어 정보, 사전정보를 이용하여 전문용어를 추출한다. 통계정보는 코퍼스에 나타난 유사어 인식, 띄어쓰기 에 따른 한국어의 이형태 인식, 명사구 사이의 내포관계, 명사구의 빈도수에 기반한다. 외래어 정보는 한국어의 음차 표기된 외래어를 자동 인식하는 것에 기반하며, 사전 정보는 전문분야 사전에 대한 정보에 기반한다. 본 논문의 기법은 정확율과 재현율면에서 성능향상을 보였다.
Advisors
최기선researcherChoi, Key-Sunresearcher
Description
한국과학기술원 : 전산학전공,
Publisher
한국과학기술원
Issue Date
2000
Identifier
157555/325007 / 000983346
Language
kor
Description

학위논문(석사) - 한국과학기술원 : 전산학전공, 2000.2, [ iv, 56 p. ]

Keywords

인식; 추출; 전문용어; 코퍼스; Corpus; Detection; Extraction; Termninologies

URI
http://hdl.handle.net/10203/34390
Link
http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=157555&flag=dissertation
Appears in Collection
CS-Theses_Master(석사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0