한글 문서의 효과적인 검색을 위한 n-Gram 기반의 색인 방법An n-Gram-Based Indexing Method for Effective Retrieval of Hangul Texts

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 659
  • Download : 0
기존의 한글 자동 색인 방법들은 어절 단위 색인법과 형태소 단위 색인법으로 분류될 수 있다. 전자는 문서내의 어절에서 비색인 분절을 절단함으로써 색인어를 추출하는 방법으로, 문서들이 많은 복합 명사들을 포함할 경우 검색 효과가 저하된다. 후자는 형태소 해석이나 구문 해석을 이용하여 중요한 의미를 갖는 명사나 명사구를 추출하는 방법으로 단일 명사를 추출함으로써 복합 명사의 띄어쓰기 문제를 극복할 수 있다. 그러나 색인 과정에서 요구되는 많은 언어 정보를 개발하고 유지 보수해야 하는 부담을 지니고 있다. 본 논문에서는 기존의 색인 방법들의 문제점들을 완화할 수 있는 새로운 색인 방법을 제안한다. 그리고 실험을 통하여 제안하는 방법의 성능을 평가한다.
Publisher
한국정보관리학회
Issue Date
1996-06
Language
Korean
Citation

정보관리학회지, v.13, no.1, pp.47 - 63

ISSN
1013-0799
URI
http://hdl.handle.net/10203/74980
Appears in Collection
CS-Journal Papers(저널논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0