2단계 n-gram 역색인 구조 및 그 구성 방법과 질의처리 방법 및 그 색인 도출 방법A TWO-LEVEL n-gram INVERTED INDEX STRUCTURE AND METHODSFOR INDEX BUILDING AND QUARY PROCESSING AND INDEXDERIVING OF IT

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 720
  • Download : 0
본 발명은 n-gram 역색인에 존재하는 위치 정보의 중복을 제거하여 n-gram에 비해 그 크기를 줄이고 질의 처리 성능을 향상시킬 수 있는 2단계 n-gram 역색인 구조 및 그 구성 방법과 질의 처리 방법 및 그 색인 도출 방법을 제공한다.본 발명의 역색인은 문서로부터 추출된 서브시퀀스들을 용어로 사용하는 백-엔드 역색인 및 상기 서브시퀀스로부터 추출된 n-gram들을 용어로 사용하는 프런트-엔드 역색인으로 구성되며,상기 백-엔드 역색인은 문서로부터 서로 n-1(n : n-gram의 길이)씩 겹치도록 추출된 소정 길이의 서브시퀀스들을 용어로서 사용하고, 각 서브시퀀스에 대한 포스팅 리스트에는 그 서브시퀀스가 문서상에서 나타난 위치 정보들을 저장하며, 상기 프런트-엔드 역색인은 상기 서브시퀀스로부터 1-슬라이딩 방식으로 추출된 소정 길이의 n-gram들을 용어로서 사용하고, 각 n-gram에 대한 포스팅 리스트에는 그 n-gram이 서브시퀀스 상에서 나타난 위치 정보들을 저장하는 것을 특징으로 한다. 역색인, n-gram, 데이터베이스, 문자열, 서브시퀀스, 프런트-엔드 역색인, 백-엔드 역색인
Assignee
한국과학기술원
Country
KO (South Korea)
Application Date
2005-08-26
Application Number
10-2005-0078687
Registration Date
2007-05-30
Registration Number
10-0725664-0000
URI
http://hdl.handle.net/10203/232701
Appears in Collection
CS-Patent(특허)IE-Patent(특허)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0