한국어 병렬구문과 결합범주문법에서의 구문분석Coordinate constructions in Korean and parsing issues in combinatory categorial grammar

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 742
  • Download : 0
사람이 사용하는 자연언어는 정해진 구문 형식과 의미가 있는 인공 언어와 달리 매우 다양하게 표현되며, 사용하는 어휘도 제한되어 있지 않고, 비정형화된 문장도 사용된다. 특히 병렬구문은 자주 사용되는 문형임에도 불구하고 분석의 복잡성, 단어의 중의성, 서술어 생략 등에 따른 처리의 어려움을 내포하고 있다. 대부분의 한국어처리를 위한 문법들이 정규문장성분만을 고려해서 고안되었기 때문에 서술어의 생략으로 인해 병렬문의 접속항에 나타나는 비정규문장성분을 표현하고 의미를 분석하는데 한계를 보이고 있다. 본 논문에서는 한국어에서 발생하는 다양한 형태의 병렬문을 능력문법 (competence grammar)의 입장에서 논의하고 논의된 다양한 형태의 병렬문을 결합범주문법을 이용해 설명한다. 서술어의 생략으로 인해 발생하는 비정규문장성분을 결합범주문법의 type raising과 composition 축약규칙을 이용해 문법적, 의미적으로 해결 한다. 병렬구문을 처리하는 과정에서 적용된 축약규칙을 바탕으로 한국어 병렬문처리를 위한 축약규칙을 제안한다. 제안된 결합범주문법의 축약규칙은 한국어에서 나타나는 다양한 형태의 접속항을 문법적, 의미적으로 처리할 수 있으므로 병렬문 이외의 다양한 한국어 문형을 처리하는 데에도 적용 가능하다고 볼 수 있다. 한국어 조사 `은/는``과 문장에서 나타나는 고저 악센트 (pitch accent)를 바탕으로 한국어에 대한 정보구조 (information structure)를 제안하고 이를 통해 한국어 병렬문에서 나타나는 나열과 대조의 문맥적 기능를 구별한다. 제안된 축약규칙과 정보구조를 이용해 병렬문에 대한 각각 다른 수준의 통사적, 의미적, 문맥적 정보들이 사전에 어휘적으로 통합될 수 있고 통합된 정보를 이용하여 문법적, 의미적, 문맥적 분석들이 각각 다른 수준의 처리를 거치지 않고 동시에 점진적으로 유도될 수 있음을 보인다.한국어 명사구 병렬의 구조적 애매성으로 인한 구문분석상의 문제점에 대해 논의한다. 결합범주문법이 통사적 처리와 의미적 처리를 점진적으로 동시에 할 수 있다는 특징을 이용하여 spurious ambiguity로 인한 문제점에 대한 개선책을 제시하고 말뭉치에서 쓰인 용례를 기반으로 한 명사들간의 공기 유사도을 이용하여 명사구 병렬의구조적 애매성을 해소한다. 말뭉치에 나타나는 용례의 부족에 기인한 공기 유사도 정보의 오류를 수동으로 구축한 시소러스를 이용하여 개선한다.
Advisors
박종철researcherPark, Jong-Cheolresearcher
Description
한국과학기술원 : 전산학전공,
Publisher
한국과학기술원
Issue Date
2000
Identifier
157566/325007 / 000983572
Language
kor
Description

학위논문(석사) - 한국과학기술원 : 전산학전공, 2000.2, [ iv, 49 p. ]

Keywords

구문분석; 능력문법; 결합범주문법; 공기유사성; Co-occurrence similarity; Parsing; Competence grammar; Combinatory categorial grammar

URI
http://hdl.handle.net/10203/34400
Link
http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=157566&flag=dissertation
Appears in Collection
CS-Theses_Master(석사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0