안녕하세요? 말씀 주셔서 감사합니다.
혹시 태국어 철자에 대해서 얼마나 잘 알고 계신가요? 외래어 표기법의 표기 일람표만 보면 꽤 규칙적일 것 같지만 알아볼수록 복잡합니다.
타이 문자에서 모음 기호는 자음 글자의 오른쪽과 위쪽에 붙을 수 있을 뿐만이 아니라 왼쪽에 붙을 수도 있고 양옆에 붙을 수도 있습니다. 그래서 자음 기호의 왼쪽에 붙는 모음 기호의 경우 แ-, โ-처럼 자음 기호를 대신해 하이픈(-)으로 나타낸 것입니다. 그런데 유니코드에서는 이전의 코드 방식과의 호환성 때문에 왼쪽에 붙는 모음 기호를 먼저 인코딩하고 자음 기호를 나중에 인코딩하는 방식을 택했습니다. 자음 기호의 양옆에 붙는 모음 기호의 경우 왼쪽 부분 - 자음 기호 - 오른쪽 부분의 순서로 나눠서 인코딩하고요. 다른 인도계 문자는 소리 순서대로 인코딩하는데 타이 문자만 처리 방식이 독특한 것입니다. 예를 들어서 kue를 나타내는 แก는 ue를 나타내는 แ, k를 나타내는 ก 순으로 입력해야 합니다.
또 태국어 철자법에서는 띄어쓰기를 하지 않기 때문에 단어 구분이 까다롭고 심지어 복합어의 내부 경계 설정도 어렵습니다. 태국어의 음소 배열 규칙을 참조하여 짐작할 수 밖에 없습니다. 철자에는 나타나지 않는 겹자음도 한글 표기에서는 반영해야 합니다. 또 태국어는 산스크리트어나 팔리어에서 온 차용어에서 발음이 불규칙한 것이 매우 많습니다. 예를 들어서 ชินวัตร는 원 철자만 보면 Chinawatra로 발음해야 할 것 같지만 น이 겹자음으로 발음되고 ร이 묵음이라서 Chinnawat과 같이 발음되며 한글 표기는 '친나왓'으로 해야 합니다. 이런 경우까지 제대로 변환하려면 여러 불규칙 발음을 데이터베이스로 만든 사전이 필요합니다.
이것은 비단 한글 표기 뿐만이 아니라 로마자 표기에도 해당합니다. 다음 링크는 쭐랄롱꼰 대학 언어학과에서 만든 태국어 철자를 로마자로 변환하는 프로그램입니다. 단순히 철자에 나타나는 글자를 하나하나 변환시키는 것이 아니라 데이터베이스를 참조하여 발음에 따라 표기해야 하기 때문에 매 버전마다 데이터베이스를 보완하고 있습니다.