본 발명의 문서 분석 방법은 복수의 문서를 소정 기준에 따라 복수의 집단으로 분류하는 단계; 상기 집단 각각에 대해서 의미 단어 집합을 추출하되, 해당 집단을 대표하는 정도를 나타내는 가중치와 함께 추출하는 단계; 상기 집단 각각의 의미 단어 집합으로부터 해당 집단의 독특성을 갖는 중요 단어 집합을 추출하는 단계; 및 상기 복수의 집단 각각에 대한 상기 중요 단어 집합 사이의 유사도를 측정함으로써 상기 복수의 집단 사이의 유사도를 추론하는 단계를 포함한다.