대용량 웹 서비스 상의 웹 로봇 분류를 위한 특성화 연구Metrics for classification of web robots: an empirical study based on over one billion requests

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 567
  • Download : 0
웹 환경이 급속하게 발전함에 따라, 다양한 목적의 웹 로봇이 등장하였고 웹 로봇의 특성을 분석하고 탐지를 위한 연구가 다각도로 수행되었다. 하지만 대부분의 연구는 상대적으로 소규모이거나 제한된 환경을 대상으로 수행되었거나, 또는 작은 데이터를 이용하여 수행되었다는 한계를 가졌다. 무엇보다 중요한 이전 연구의 한계점은, 아주 적은 연구만이 서로 다른 로봇 유형들간의 분류 및 특성화 분석을 수행 하였다는 것이다. 본 논문에서는 다양한 유형의 웹 로봇의 탐지 및 분류를 위하여 마이크로소프트사의 웹 서버에서 수집된 250GB분량의 10억 건의 접근 데이터를 사용, 기존에 제안된 로봇의 특성 이외에도 웹 로봇 워크로드 특성, 접근 자원 유형 및 접근 방법에 대한 특성 평가지표를 바탕으로 특성화 메트릭을 제안한다. 각 특성화 메트릭을 바탕으로, 각 웹 로봇의 유효 특성들을 폴라 다이어그램 스키마에 따라 하나의 비교 메트릭을 제안한다. 일반 사용자와의 특성들을 비교분석 하기 위하여 비교 메트릭은 각 유효 특성 들을 5개의 그룹으로 나누며, 분류 효율성에 따라 5개의 그룹의 우선 순위에 따라 정렬 되어 표현 되었다. 논문에서 다루는 실험은 이러한 비교 메트릭을 이용하여 마이크로소프트, 구글, 야후등의 검색엔진회사에서 사용하는 웹 로봇 이외에도 아이콘 수집기나 이미지크롤러 및 링크체커를 명확이 분류 할 수 있음을 보여 준다. 본 연구의 결과는 서로 다른 유형의 웹 로봇을 탐지 하고 그 역할에 따라 분류 하는 관련 연구에 매우 유용한 결과를 가져다 줄 것이다
Advisors
한환수researcherHan, Hwan-sooresearcher
Description
한국과학기술원 : 전산학전공,
Publisher
한국과학기술원
Issue Date
2008
Identifier
302017/325007  / 020063449
Language
kor
Description

학위논문(석사) - 한국과학기술원 : 전산학전공, 2008. 8., [ iv, 25 p ]

Keywords

Web robot; Web security; Web robot classification; network security; anomaly detection; 웹 로봇; 웹 보안; 웹 로봇 특성화; 네트워크 보안; 이상 탐지; Web robot; Web security; Web robot classification; network security; anomaly detection; 웹 로봇; 웹 보안; 웹 로봇 특성화; 네트워크 보안; 이상 탐지

URI
http://hdl.handle.net/10203/34836
Link
http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=302017&flag=dissertation
Appears in Collection
CS-Theses_Master(석사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0