형식 문서 자동 입력 시스템에서 한글, 한자, 영문 이름 상호 참조를 이용한 이름 필드 인식 후처리A Postprocessing of Name Field Recognition Results by Cross Checking Hangul, Chinese, and Roman Names for Automatic Form Reading Systems
본 논문에서는 형식 문서 자동 인식 시스템을 위한 이름 인식 결과 후처리 방법을 제안한다. 한국에서 사용되는 많은 형식문서에는 한글 이름, 한자 이름, 영문 이름을 필기하는 필드가 함께 존재한다. 이러한 이름 필드간의 상호 관계를 이용한다면 인식기로부터 얻은 이름 인식 결과의 인식 오류를 보정하여 더 좋은 인식 성능을 얻을 수 있다. 본 논문에서는 서로 다른 언어로 쓰여진 이름간의 상호 관계를 이용하여 이름 인식 결과의 오류를 보정하는 방법을 제안한다. Dynamic Programming에 의해 다른 언어의 글자/자소간의 대응관계를 찾음으로써 인식오류를 발견하고 수정한다. 형식 문서 인식 시스템에 적용, 실험을 통해 제안된 후처리 방법이 매우 효과적임을 보였다.