문서 기반 온톨로지 생성을 위한 문장 분해 및 유사도 측정 시스템Sentence decomposition and similarity measurement for text-based ontology building

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 575
  • Download : 0
온톨로지는 지식을 컴퓨터가 처리가능 한 형태로 표현하고 교환하기 위한 포맷으로 시맨틱웹의 등장과 함께 주목받고 있다. 본 논문은 사람들이 일상생활에서 기록하는 자연언어 문서를 온톨로지 형태로 변환하여 컴퓨터가 해석하기 용이하게 만드는 것을 목표로 한다. 하지만 문서의 내용을 온전하게 온톨로지 형태로 표현하는 것은 쉽게 달성할 수 있는 목표가 아니다. 본 논문에서는 두 가지의 시스템을 제안한다. 첫째, 문장을 온톨로지로 변환할 수 있는 충분조건 및 변환 규칙을 제시한다. 또한 이 변환 규칙을 이용해, 이미 충분 조건을 만족하는 코퍼스를 온톨로지로 실제 변환하여 본다. 둘째, 이미 온톨로지로 잘 변환된 코퍼스가 있을 때, 이 코퍼스를 이용하여 새로운 입력 문장을 온톨로지로 변환하는 방법을 제시한다. 이 자동화 된 방법은 문장의 구조적 유사도를 이용하여 입력 문장을 어노테이션 하는 방식이다. 해당 방식은 많은 분류자(Classifier)를 필요로 하지 않고, 훈련 데이터가 많지 않은 경우에도 작동하며, 원문 추적이 쉽다는 장점이 있다. 실험 결과를 통해, 본 논문의 방법을 따르면 높은 정확도로 문장의 본래의 뜻을 거의 잃지 않고 문장을 온톨로지 형태로 변환할 수 있다는 것을 보인다.
Advisors
최기선researcherChoi, Key-Sunresearcher
Description
한국과학기술원 : 전산학전공,
Publisher
한국과학기술원
Issue Date
2009
Identifier
309131/325007  / 020073596
Language
kor
Description

학위논문(석사) - 한국과학기술원 : 전산학전공, 2009.2, [ viii, 55 p. ]

Keywords

NLP; Sentence Similarity Measurement; Ontology; 자연언어처리; 문장 유사도 측정; 온톨로지; NLP; Sentence Similarity Measurement; Ontology; 자연언어처리; 문장 유사도 측정; 온톨로지

URI
http://hdl.handle.net/10203/34873
Link
http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=309131&flag=dissertation
Appears in Collection
CS-Theses_Master(석사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0