온라인 커뮤니티가 활성화됨에 따라 사용자들이 생성하는 혐오 표현 또한 증가하여, 정확한 자동 혐오 표현 탐지 기술의 필요성이 더욱 강조되고 있다. 이 연구는 기존의 지도 학습 기반 혐오 표현 탐지 모델의 제한적인 일반화 성능을 극복하기 위해 지도 학습과 비지도 대조 학습을 결합해 문서 임베딩을 학습하는 모델을 제안한다. 모델은 문서의 혐오 표현 여부를 지도 학습함과 동시에 각 문서를 인코더에 두 번 통과해 얻은 임베딩을 서로 가깝게 하고, 서로 다른 문서의 임베딩은 멀리 하는 대조 학습을 진행한다. 벤치마크 데이터 셋을 통해 실험한 결과 우리 모델이 지도 학습 기반 베이스라인에 비해 분류 결과와 정체성 단어 편향 면에서 향상된 성능을 보였다.