국내 웹 그래프의 링크 구조 분석Link Structure Analysis of Korean Web Graph

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 588
  • Download : 0
웹을 구성하는 웹 페이지들과 페이지들 사이의 하이퍼링크들은 방향성을 지니는 그래프로 표현될 수 있으며, 웹 그래프가 가지는 독자적인 링크 구조의 특성은 다양한 분야의 연구에서 활용되고 있다. 현재 검색 엔진들이 수집한 웹 페이지들은 그 규모가 수십억 개로 방대한 양을 이루고 있다. 본 논문에서는 약 3억 개의 국내 웹 페이지들을 수집하고, 이들 간의 약 137억 개의 하이퍼링크들을 추출하여 생성한 웹 그래프의 구조에 대해 분석한다. 또한 그래프 알고리즘을 이용하여 웹 그래프를 구성하는 요소들로 나눈 후 전체적인 구조를 도식화한 보우타이 다이어그램을 도출한다. 국내 웹 페이지들은 링크의 진입 차수와 연결 요소들의 크기 분포에서 멱법칙을 따르며, 웹 페이지의 진출 차수는 특정 차수 이상에서 멱법칙을 따른다. 또한 웹 그래프는 평균 연결 거리가 매우 짧은 약 12 정도로 small-world network의 성질을 가지고 약 40%의 웹 페이지 쌍 사이에 경로가 존재하며, 국내 웹 그래프는 해외의 경우보다 연결도가 더 높다.
Publisher
한국정보과학회
Issue Date
2013-01
Language
Korean
Citation

정보과학회논문지 : 컴퓨팅의 실제 및 레터, v.19, no.1, pp.7 - 14

ISSN
1229-7712
URI
http://hdl.handle.net/10203/201647
Appears in Collection
PH-Journal Papers(저널논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0