분포 외 데이터 문제를 활용한 암묵적 언어폭력 탐지Detecting Implicitly Abusive Language by Applying Out-of-Distribution Problem

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 217
  • Download : 0
암묵적 언어폭력 탐지는 표현의 다양성과 명확한 기준의 부재로 인하여 해결하기 어려운 문제이다. 선행연구에 따르면 암묵적 언어폭력을 세세하게 분류하고 정의함과 동시에 이에 해당하는 데이터셋을 만드는 과정이 필요하다. 그러나 이는 효율적이지 않을 뿐만 아니라 언어의 변화에 유연하게 대처하기 어렵다는 단점이 있다. 본 연구는 이를 해결하기 위한 효율적이고 효과적인 방법론으로 암묵적 언어폭력을 분포 외 데이터로 처리하는 방법을 처음으로 제안한다. 암묵적 언어폭력 탐지에서 분포 외 데이터 방법론을 적용한 사전학습 모델이 일반 사전학습 모델과 어휘 기반 모델보다 효과적임을 실험을 통해 확인하였다. 또한 감성분석과 사례 연구를 통하여 암묵적 언어폭력의 특성을 살펴보았으며 일반 사전학습 모델과 본 연구에서 제안하는 모델의 차이를 자세히 분석하였다.
Publisher
한국정보과학회
Issue Date
2022-11
Language
Korean
Citation

정보과학회논문지, v.49, no.11, pp.948 - 957

ISSN
2383-630X
DOI
10.5626/jok.2022.49.11.948
URI
http://hdl.handle.net/10203/301042
Appears in Collection
CS-Journal Papers(저널논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0