국립국어원 사이트 내 태국어 관련 질문입니다.

111 views

Skip to first unread message

hect...@gmail.com

unread,

Mar 2, 2016, 9:44:15 AM3/2/16

to Hangulize

안녕하세요. 저는 학교에서 언어학을 듣고 관심이 생겨서 이전에 가입하였고, 현재는 Hangulize 메뉴에 없는 <태국어 변환>을 만들고 있습니다. 늦은 인사 죄송합니다.

제가 이렇게 메시지를 보내는 까닭은 국립국어원의 타이어(이하 태국어) 표기 일람표가 제대로 되어있지 않아 다른 곳을 참조하려고 하는데, 그래도 괜찮은지 여쭤보기 위해서입니다. Hangulize는 국립국어원에 명시된 규칙을 기반으로 작동되는 것으로 알고 있습니다. 하지만 국립국어원 태국어 표기 일람표(http://www.korean.go.kr/front/page/pageView.do?page_id=P000119&mn_id=97)를 보시면

① 태국어가 쓰여있는 곳에 "-"로 되어 있는 것(e.g. ue 의 แ-, o 의 โ- 등에 - 대신 ก가 들어가야 함.)은 장음의 표시가 아닌 태국 글자가 있어야 하는 부분이 존재합니다.

② ①번의 이유 때문에 일부 규칙은 구글링을 해도 예제가 전혀 검색되지 않는 어려움이 있습니다.

③ 표기 일람표 란에 있는 몇몇 태국 글자는 세로로 합쳐져 있는 모양을 표기하기 위하여, 글자들을 가로로 늘여서 유니코드로 표현하지 않고 이미지 파일로 만들어 표기된 상태입니다. (e.g. ue 옆에 있는 글자에서 오른쪽 클릭하시면 이미지와 관련한 메뉴를 보실 수 있습니다.)

이러한 이유로 인하여 현재 저는 부득이하게 위키백과를 보고 참조하고 있습니다. 국립국어원보다 발음기호가 상세히 기록되어 있고 분류도 자세하며, 태국어 글자 또한 이미지 파일이 아닌 모두 글자로 인식되어서 제작이 용이합니다. 혹자는 위키백과는 믿을 수 없다고 하지만, 현재의 상황을 보았을 땐 국립국어원보단 위키백과를 활용하는 게 낫다고 판단했습니다. 그리고 위키백과의 표기 일람표를 참조하고 국립국어원의 표기 세칙을 따른다면 두 사이트를 모두 아우를 수 있는 규칙이 완성되어 더 상세하게 이룰 수 있을거라 생각합니다. 혹시 신뢰가 가지 않아 안된다고 하시면 다른 곳을 알아보겠습니다. 읽어주셔서 감사합니다.

Brian Jongseong Park

unread,

Mar 2, 2016, 3:13:02 PM3/2/16

to hangulize

안녕하세요? 말씀 주셔서 감사합니다.

혹시 태국어 철자에 대해서 얼마나 잘 알고 계신가요? 외래어 표기법의 표기 일람표만 보면 꽤 규칙적일 것 같지만 알아볼수록 복잡합니다.

타이 문자에서 모음 기호는 자음 글자의 오른쪽과 위쪽에 붙을 수 있을 뿐만이 아니라 왼쪽에 붙을 수도 있고 양옆에 붙을 수도 있습니다. 그래서 자음 기호의 왼쪽에 붙는 모음 기호의 경우 แ-, โ-처럼 자음 기호를 대신해 하이픈(-)으로 나타낸 것입니다. 그런데 유니코드에서는 이전의 코드 방식과의 호환성 때문에 왼쪽에 붙는 모음 기호를 먼저 인코딩하고 자음 기호를 나중에 인코딩하는 방식을 택했습니다. 자음 기호의 양옆에 붙는 모음 기호의 경우 왼쪽 부분 - 자음 기호 - 오른쪽 부분의 순서로 나눠서 인코딩하고요. 다른 인도계 문자는 소리 순서대로 인코딩하는데 타이 문자만 처리 방식이 독특한 것입니다. 예를 들어서 kue를 나타내는 แก는 ue를 나타내는 แ, k를 나타내는 ก 순으로 입력해야 합니다.

또 태국어 철자법에서는 띄어쓰기를 하지 않기 때문에 단어 구분이 까다롭고 심지어 복합어의 내부 경계 설정도 어렵습니다. 태국어의 음소 배열 규칙을 참조하여 짐작할 수 밖에 없습니다. 철자에는 나타나지 않는 겹자음도 한글 표기에서는 반영해야 합니다. 또 태국어는 산스크리트어나 팔리어에서 온 차용어에서 발음이 불규칙한 것이 매우 많습니다. 예를 들어서 ชินวัตร는 원 철자만 보면 Chinawatra로 발음해야 할 것 같지만 น이 겹자음으로 발음되고 ร이 묵음이라서 Chinnawat과 같이 발음되며 한글 표기는 '친나왓'으로 해야 합니다. 이런 경우까지 제대로 변환하려면 여러 불규칙 발음을 데이터베이스로 만든 사전이 필요합니다.

이것은 비단 한글 표기 뿐만이 아니라 로마자 표기에도 해당합니다. 다음 링크는 쭐랄롱꼰 대학 언어학과에서 만든 태국어 철자를 로마자로 변환하는 프로그램입니다. 단순히 철자에 나타나는 글자를 하나하나 변환시키는 것이 아니라 데이터베이스를 참조하여 발음에 따라 표기해야 하기 때문에 매 버전마다 데이터베이스를 보완하고 있습니다.

http://pioneer.chula.ac.th/~awirote/resources/thai-romanization.html

--
이 메일은 Google 그룹스 'Hangulize' 그룹에 가입한 분들에게 전송되는 메시지입니다.
이 그룹에서 탈퇴하고 더 이상 이메일을 받지 않으려면 hangulize+...@googlegroups.com에 이메일을 보내세요.
더 많은 옵션을 보려면 https://groups.google.com/d/optout을(를) 방문하세요.

Reply all

Reply to author

Forward

0 new messages