DC Field | Value | Language |
---|---|---|
dc.contributor.author | 황규영 | ko |
dc.contributor.author | 김민수 | ko |
dc.contributor.author | 이재길 | ko |
dc.contributor.author | 이민재 | ko |
dc.date.accessioned | 2017-12-20T10:36:22Z | - |
dc.date.available | 2017-12-20T10:36:22Z | - |
dc.identifier.uri | http://hdl.handle.net/10203/232701 | - |
dc.description.abstract | 본 발명은 n-gram 역색인에 존재하는 위치 정보의 중복을 제거하여 n-gram에 비해 그 크기를 줄이고 질의 처리 성능을 향상시킬 수 있는 2단계 n-gram 역색인 구조 및 그 구성 방법과 질의 처리 방법 및 그 색인 도출 방법을 제공한다.본 발명의 역색인은 문서로부터 추출된 서브시퀀스들을 용어로 사용하는 백-엔드 역색인 및 상기 서브시퀀스로부터 추출된 n-gram들을 용어로 사용하는 프런트-엔드 역색인으로 구성되며,상기 백-엔드 역색인은 문서로부터 서로 n-1(n : n-gram의 길이)씩 겹치도록 추출된 소정 길이의 서브시퀀스들을 용어로서 사용하고, 각 서브시퀀스에 대한 포스팅 리스트에는 그 서브시퀀스가 문서상에서 나타난 위치 정보들을 저장하며, 상기 프런트-엔드 역색인은 상기 서브시퀀스로부터 1-슬라이딩 방식으로 추출된 소정 길이의 n-gram들을 용어로서 사용하고, 각 n-gram에 대한 포스팅 리스트에는 그 n-gram이 서브시퀀스 상에서 나타난 위치 정보들을 저장하는 것을 특징으로 한다. 역색인, n-gram, 데이터베이스, 문자열, 서브시퀀스, 프런트-엔드 역색인, 백-엔드 역색인 | - |
dc.title | 2단계 n-gram 역색인 구조 및 그 구성 방법과 질의처리 방법 및 그 색인 도출 방법 | - |
dc.title.alternative | A TWO-LEVEL n-gram INVERTED INDEX STRUCTURE AND METHODSFOR INDEX BUILDING AND QUARY PROCESSING AND INDEXDERIVING OF IT | - |
dc.type | Patent | - |
dc.type.rims | PAT | - |
dc.contributor.localauthor | 황규영 | - |
dc.contributor.localauthor | 이재길 | - |
dc.contributor.nonIdAuthor | 이민재 | - |
dc.contributor.assignee | 한국과학기술원 | - |
dc.identifier.iprsType | 특허 | - |
dc.identifier.patentApplicationNumber | 10-2005-0078687 | - |
dc.identifier.patentRegistrationNumber | 10-0725664-0000 | - |
dc.date.application | 2005-08-26 | - |
dc.date.registration | 2007-05-30 | - |
dc.publisher.country | KO | - |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.