DC Field | Value | Language |
---|---|---|
dc.contributor.author | 신민기 | ko |
dc.contributor.author | 진효진 | ko |
dc.contributor.author | 송현호 | ko |
dc.contributor.author | 최정회 | ko |
dc.contributor.author | 임현승 | ko |
dc.contributor.author | 차미영 | ko |
dc.date.accessioned | 2021-11-23T06:46:03Z | - |
dc.date.available | 2021-11-23T06:46:03Z | - |
dc.date.created | 2021-11-17 | - |
dc.date.created | 2021-11-17 | - |
dc.date.created | 2021-11-17 | - |
dc.date.issued | 2021-10 | - |
dc.identifier.citation | 제 33회 한글 및 한국어 정보처리 학술대회, pp.518 - 523 | - |
dc.identifier.issn | 2005-3053 | - |
dc.identifier.uri | http://hdl.handle.net/10203/289397 | - |
dc.description.abstract | 챗봇과 같은 대화형 에이전트 사용이 증가하면서 채팅에서의 혐오 표현 사용도 더불어 증가하고 있다. 혐오 표현을 자동으로 탐지하려는 노력은 다양하게 시도되어 왔으나, 챗봇 데이터를 대상으로 한 혐오 표현 탐지 연구는 여전히 부족한 실정이다. 이 연구는 혐오 표현을 포함한 챗봇-사용자 대화 데이터 35만 개에 한국어 말뭉치로 학습된 KoELETRA 기반 혐오 탐지 모델을 적용하여, 챗봇-사람 데이터셋에서의 혐오 표현 탐지의 성능과 한계점을 검토하였다. KoELECTRA 혐오 표현 분류 모델은 챗봇 데이터셋에 대해 가중 평균 F1-score 0.66의 성능을 보였으며, 오탈자에 대한 취약성, 맥락 미반영으로 인한 편향 강화, 가용한 데이터의 정확도 문제가 주요한 한계로 포착되었다. 이 연구에서는 실험 결과에 기반해 성능 향상을 위한 방향성을 제시한다. | - |
dc.language | English | - |
dc.publisher | 한국정보과학회 언어공학연구회 | - |
dc.title | Hate Speech Detection in Chatbot Data Using KoELECTRA | - |
dc.type | Conference | - |
dc.type.rims | CONF | - |
dc.citation.beginningpage | 518 | - |
dc.citation.endingpage | 523 | - |
dc.citation.publicationname | 제 33회 한글 및 한국어 정보처리 학술대회 | - |
dc.identifier.conferencecountry | KO | - |
dc.identifier.conferencelocation | 온라인 | - |
dc.contributor.localauthor | 차미영 | - |
dc.contributor.nonIdAuthor | 신민기 | - |
dc.contributor.nonIdAuthor | 진효진 | - |
dc.contributor.nonIdAuthor | 최정회 | - |
dc.contributor.nonIdAuthor | 임현승 | - |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.