Hate Speech Detection in Chatbot Data Using KoELECTRA

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 408
  • Download : 0
DC FieldValueLanguage
dc.contributor.author신민기ko
dc.contributor.author진효진ko
dc.contributor.author송현호ko
dc.contributor.author최정회ko
dc.contributor.author임현승ko
dc.contributor.author차미영ko
dc.date.accessioned2021-11-23T06:46:03Z-
dc.date.available2021-11-23T06:46:03Z-
dc.date.created2021-11-17-
dc.date.created2021-11-17-
dc.date.created2021-11-17-
dc.date.issued2021-10-
dc.identifier.citation제 33회 한글 및 한국어 정보처리 학술대회, pp.518 - 523-
dc.identifier.issn2005-3053-
dc.identifier.urihttp://hdl.handle.net/10203/289397-
dc.description.abstract챗봇과 같은 대화형 에이전트 사용이 증가하면서 채팅에서의 혐오 표현 사용도 더불어 증가하고 있다. 혐오 표현을 자동으로 탐지하려는 노력은 다양하게 시도되어 왔으나, 챗봇 데이터를 대상으로 한 혐오 표현 탐지 연구는 여전히 부족한 실정이다. 이 연구는 혐오 표현을 포함한 챗봇-사용자 대화 데이터 35만 개에 한국어 말뭉치로 학습된 KoELETRA 기반 혐오 탐지 모델을 적용하여, 챗봇-사람 데이터셋에서의 혐오 표현 탐지의 성능과 한계점을 검토하였다. KoELECTRA 혐오 표현 분류 모델은 챗봇 데이터셋에 대해 가중 평균 F1-score 0.66의 성능을 보였으며, 오탈자에 대한 취약성, 맥락 미반영으로 인한 편향 강화, 가용한 데이터의 정확도 문제가 주요한 한계로 포착되었다. 이 연구에서는 실험 결과에 기반해 성능 향상을 위한 방향성을 제시한다.-
dc.languageEnglish-
dc.publisher한국정보과학회 언어공학연구회-
dc.titleHate Speech Detection in Chatbot Data Using KoELECTRA-
dc.typeConference-
dc.type.rimsCONF-
dc.citation.beginningpage518-
dc.citation.endingpage523-
dc.citation.publicationname제 33회 한글 및 한국어 정보처리 학술대회-
dc.identifier.conferencecountryKO-
dc.identifier.conferencelocation온라인-
dc.contributor.localauthor차미영-
dc.contributor.nonIdAuthor신민기-
dc.contributor.nonIdAuthor진효진-
dc.contributor.nonIdAuthor최정회-
dc.contributor.nonIdAuthor임현승-
Appears in Collection
CS-Conference Papers(학술회의논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0