감정 기반 블로그 문서 분류를 위한 부정어 처리 및 단어 가중치 적용 기법의 효과에 대한 연구A Study on Negation Handling and Term Weighting Schemes and Their Effects on Mood-based Text Classification

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 875
  • Download : 723
DC FieldValueLanguage
dc.contributor.author정유철ko
dc.contributor.author최윤정ko
dc.contributor.author맹성현ko
dc.date.accessioned2010-03-18T06:38:05Z-
dc.date.available2010-03-18T06:38:05Z-
dc.date.created2012-02-06-
dc.date.created2012-02-06-
dc.date.issued2008-12-
dc.identifier.citation인지과학, v.19, no.4, pp.477 - 497-
dc.identifier.issn1226-4067-
dc.identifier.urihttp://hdl.handle.net/10203/17231-
dc.description.abstract일상생활에서 많이 쓰이는 블로그 문서를 분석하는 것은 다양한 웹 응용서비스를 연결할 수 있는 중요한 단초를 제시하므로, 블로그 문서에 담긴 감정을 파악하는 것을 매우 유용한 일이다. 본 논문에서는 블로그 문서에 존재하는 감정을 보다 정확하게 분류하기 위해 부정어 처리와 새로운 단어 가중치의 적용이 성능에 미치는 영향에 대해 탐구한다. 특히, 감정 단서(clue)가 내재된 정규화된 부정어 n-gram을 통해 부정어 처리를 고도화하고 말뭉치기반 단어 가중치 계산법(Corpus-specific Term Weighting, CSTW)을 통해 감정 분류 성능향상을 살펴보기로 한다. 검증을 위해 블로그 문서들로 정답 말뭉치를 구축하고 감정 흐름 분석(Enhanced Mood Flow Analysis, EMFA)과 지지벡터기계기반 감정 분류(Support Vector Machine based Mood Classification, SVMMC)의 두 가지 분류기법에 대해 실험을 하였다. 정규화된 부정어 n-gram의 적용은 EMFA에서 점진적인 감정 분류 성능 향상을 보여주었으며, CSTW의 적용은 TF*IDF나 TF에 비해 보다 높은 감정 분류 성능을 나타내었다.-
dc.description.sponsorship본 연구는 지식경제부 및 정보통신연구진흥원의 IT핵심기술개발사업의 일환으로 수행 {2008-F-047-01, Urban Computing Middleware 기술 개발} 하고, 과학기술부(K20711000007-07A0100-00710) 및 한국과학기술협력재단의 지원을 받았으며, 2008년도 2단계 BK 21 사업의 일환으로 수행되었습니다.en
dc.languageKorean-
dc.language.isokoen
dc.publisher한국인지과학회-
dc.title감정 기반 블로그 문서 분류를 위한 부정어 처리 및 단어 가중치 적용 기법의 효과에 대한 연구-
dc.title.alternativeA Study on Negation Handling and Term Weighting Schemes and Their Effects on Mood-based Text Classification-
dc.typeArticle-
dc.subject.alternativeMood Classificationen
dc.subject.alternativeNormalized Negation N-gramen
dc.subject.alternativeWeighting Schemeen
dc.subject.alternativeEMFAen
dc.subject.alternativeSVMMCen
dc.type.rimsART-
dc.citation.volume19-
dc.citation.issue4-
dc.citation.beginningpage477-
dc.citation.endingpage497-
dc.citation.publicationname인지과학-
dc.identifier.kciidART001306153-
dc.contributor.localauthor맹성현-
dc.contributor.nonIdAuthor정유철-
dc.contributor.nonIdAuthor최윤정-
dc.subject.keywordAuthorMood Classification-
dc.subject.keywordAuthorNormalized Negation N-gram-
dc.subject.keywordAuthorWeighting Scheme-
dc.subject.keywordAuthorEMFA-
dc.subject.keywordAuthorSVMMC-
dc.subject.keywordAuthor감정 분류-
dc.subject.keywordAuthor정규화된 부정어 n-gram-
dc.subject.keywordAuthor단어 가중치 계산법-
dc.subject.keywordAuthor감정흐름분석-
dc.subject.keywordAuthor지지벡터기계기반 감정 분류-
Appears in Collection
CS-Journal Papers(저널논문)
Files in This Item
51949.pdf(988.7 kB)Download

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0