Contrastive learning for Hate speech detection

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 348
  • Download : 0
온라인 커뮤니티가 활성화됨에 따라 사용자들이 생성하는 혐오 표현 또한 증가하여, 정확한 자동 혐오 표현 탐지 기술의 필요성이 더욱 강조되고 있다. 이 연구는 기존의 지도 학습 기반 혐오 표현 탐지 모델의 제한적인 일반화 성능을 극복하기 위해 지도 학습과 비지도 대조 학습을 결합해 문서 임베딩을 학습하는 모델을 제안한다. 모델은 문서의 혐오 표현 여부를 지도 학습함과 동시에 각 문서를 인코더에 두 번 통과해 얻은 임베딩을 서로 가깝게 하고, 서로 다른 문서의 임베딩은 멀리 하는 대조 학습을 진행한다. 벤치마크 데이터 셋을 통해 실험한 결과 우리 모델이 지도 학습 기반 베이스라인에 비해 분류 결과와 정체성 단어 편향 면에서 향상된 성능을 보였다.
Publisher
한국정보과학회
Issue Date
2022-07-01
Language
Korean
Citation

2022 한국컴퓨터종합학술대회 (KCC2022)

URI
http://hdl.handle.net/10203/299656
Appears in Collection
CS-Conference Papers(학술회의논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0