한글 모아쓰기에 관한 연구A study on the Hangul formation

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 2156
  • Download : 0
한글 기계화의 문제는 매우 긴요하고도 시급한 문제이다. 현재 한글 기계화를 위한 노력은 타자기, 텔레타이프, 컴퓨터 등 여러 분야에서 시도되고 있다. 로마자와는 달리 1 개의 자모가 여러가지 위치와 형태를 가지고 있는 한글에서는 글자판 통일에 많은 문제점을 가지게 된다. 즉, 로마자와는 달리 인간공학적인 견지에서 타자 속도를 증가시키기 위한 고려 이외에, 몇벌식 (컴퓨터의 경우는 2.5벌식으로 충분하다) 으로 글자판을 배열 할것인가 하는 문제를 타자기와 컴퓨터 2가지의 상호 모순을 적절히 충족 시켜주면서 해결하여야 한다. 이 해결 방안의 하나로서 서로 공용되는 중요한 key 들은 공통으로 배열하고, 기타 서로 다른 몇가지의 key 들만을 제조자나 사용자가 서로 다르게 배열하는 방법이 제시되었다. 한글은 24자 혹은 29자(쌍자음 ㄲ, ㄸ, ㅃ, ㅆ, ㅉ의 5 개 포함) 만으로 모아쓰기 위하여는 intellegence 를 필요로 하게 된다. 이 방법으로 Right Linear Grammar 혹은 Finite Automata 를 사용하여 deterministic 하고 efficient 하게 모아쓰기를 할 수 있음을 밝혔으며, 음절간의 구분 부호가 없는 경우에는 한글 맞춤법의 특성상 기초 자모24에다 쌍자음 5개를 추가하여 29자로서 automata 를 구성하여야 함을 밝혔다. 29자의 기본자도 만으로 automata 를 구성할 수 있지만, 빈도수 등의 문제로 어떤 복모음이나 복자음들은 합쳐서 하나의 key 로 만드는 것이 더 바람직 할수가 있다. 29자의 input symbol 의 경우뿐만 아니라, 몇가지의 input symbol 을 더 추가한 경우에도 finite automata 를 구성하고, regular expression 을 사용하여 그 finite automata들이 accept 하는 language 가 한글의 super set 혹은 equivalent set 이라는 것을 보였다. Equivalent set의 경우에는 한글 모아쓰기 입력 error의 detection 혹은 recovery 를 할 수도있다. 컴퓨터 내부에서 한글을 어떻게 표현할 것인가 하는 한글 Data Structure 의 문제에도 매우 중요하다. 초성, 중성, 종성을 각각 5 bit 씩 사용하여, 한 음절을 15 bit 로 사용하는 data structure가 제안되었으며, 본 data structure 의 경우는 모아쓰여져 있으므로 풀어 쓴 data structure 의 경우에 발생하는 sorting의 문제도 해결 할 수 있음을 밝혔다. 한글 모아쓰기 automata 를 8080은 CPU 로 하는 system에서 TV 화면에 dot matrix type 으로 display 시키는 방식으로 출력을 하여서 실험하여 보았다. 한글 기계화의 과제는 공학자나 과학자 만의 문제가 아니고 국어 학계 등 여러 분야에 종사하는 사람들이 서로 힘을 합하여서 이룩 하여야 할 문제이다. 많은 사람들이 이에 깊은 관심을 가지고 연구하여 우리의 자랑인 한글을 더욱 빛내야 되겠다.
Advisors
박철희Park, Chul-Hee
Description
한국과학기술원 : 전산학과,
Publisher
한국과학기술원
Issue Date
1978
Identifier
62286/325007 / 000761127
Language
kor
Description

학위논문(석사) - 한국과학기술원 : 전산학과, 1978.2, [ [iii], 48, vi p. ]

Keywords

한국어.

URI
http://hdl.handle.net/10203/33466
Link
http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=62286&flag=dissertation
Appears in Collection
CS-Theses_Master(석사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0