ISO 15919 for India's languages

4 views
Skip to first unread message

N. Ganesan

unread,
Jul 4, 2019, 9:59:46 AM7/4/19
to வல்லமை
On Thu, Jul 4, 2019 at 8:03 AM Pandiyaraja Paramasivam <pipi...@gmail.com> wrote:
நான் தமிழ் மொழிக்கான ஆய்வினை மட்டும் தான் மேற்கொண்டேன். புள்ளிகளையும் கணக்கில் எடுத்துக்கொண்டேன். தமிழ் மொழியை எழுதுவதற்கு ரோமன் லிபி முற்றிலும் சரியானதல்ல.

உங்கள் ஆய்வை சம்ஸ்கிருதம் அல்லது  ஹிந்தி எழுத்துக்கு மேற்கொண்டால் அப்படியே பொருந்திவரும். மேலும், ஹிந்தி எழுத்து மிக காம்பேக்ட்.
எழுத்துருவின் ஒரே அளவில் ஒரு வாக்கியத்தை எழுதிப்பார்த்தால் தெரியும். அதனால், ரோமன் லிபியில் செம்மொழி தமிழோ, வடமொழியோ எழுதக்கூடாது என்று முடிவு கூற முடியாது. தமிழ் எழுத்தே தெரியாத தமிழ்ப் பெற்றோருக்குப் பிறந்த குழந்தைகள் பல லட்சக்கணக்கில் வளர்ந்து வருகின்றனர் உலகெங்கும். மொழிதான் முக்கியமே தவிர, எழுதப்படும் லிபி அதற்கு ஒரு கருவிதான். 

மலேசியா, இந்தோனேசியா, துருக்கி, ... அமெரிக்க இந்திய மொழிகள், ஆப்பிரிக்க மொழிகள், ஐரோப்பிய மொழிகள், .... என்று ஏராளமான
மொழிக்குடும்பங்களை எழுதுகிர ஒரே எழுத்து ரோமன் எழுத்து தான். அதில் இந்திய மொழிகளும், சொந்த பிராமிவழி எழுத்துக்களுடன்
எழுதப்படவேண்டும். அவ்வாறு எழுதினால், உடனே புரியும். உ-ம்: திராவிட மொழிக் குடும்பத்தாரை எடுத்துக்கொள்வோம். ஒன்றுக்கொன்று
உடனே புரியும்.

ஆங்கில மொழிக்கும், அதேபோல இந்திய மொழிகளுக்குமான ஆங்கில எழுத்துக்கும் https://en.wikipedia.org/wiki/ISO_15919     இந்தியாவில் இடமுண்டு. 
ரவி போன்றோர் இதற்கான அப்ஸ் போன்களுக்குச் செய்து உதவ வேண்டுகிறேன். தெருப்பலகை, விண்ணப்ப பாரம்கள் படிக்க உதவும்.

இன்றைய கணித் தமிழெழுத்தில் ஆர்ய அட்சரம் 5 (ஜ , ஷ , ஶ, ஸ , ஹ ) உள்ளன. தேவையானோர் பயன்கொள்கின்றனர் என்பது இணையத்தை, அச்சு நூல்களை ஆராய்ந்து பார்த்தால் உடனே தெரிந்துவிடும்.  அதே போலத் தான் ஐஎஸ்ஓ 15919. மக்களுக்குப் பரவலாக இதன் பயன்கள் தெரிந்தால் பயன்படுத்துவோர் பலராவர்.

நா. கணேசன்


On Thu, 4 Jul, 2019, 18:28 N. Ganesan, <naa.g...@gmail.com> wrote:


- hide quoted text -
On Thu, Jul 4, 2019 at 6:37 AM Pandiyaraja Paramasivam <pipi...@gmail.com> wrote:
In my Ph.D thesis I have established that the Roman script is most unsuitable for Tamil. It makes the average word length longer, the main reason being that Tamil script uses the concept of உயிர்மெய் எழுத்துக்கள்.
Even in the example cited here, one can notice that the Tamil version requires less than 40 characters while the Roman script version requires more than 60 characters.
P.Pandiyaraja

எல்லா இந்திய மொழிகளும்தான் உயிர்மெய்யெழுத்துக்களைப் பயன்படுத்துகின்றன. புள்ளி இருப்பதால் ஹிந்தி எழுத்தைவிட வரிநீளம் தமிழ் எழுத்தில் அதிகம் ஆகிறது.வேர்ச்சொல் ஆய்வுக்கு ரோமன் எழுத்துதான் ராசா.

செம்மொழி என்ற நிலை ஒரு மொழிக்கு ஏற்படுவதன் காரணமே, அந்த  மொழி பல லிபிகளில் காலங்காலமாக எழுதப்படல் வேண்டும்.
உ-ம்: தமிழை, சம்ஸ்கிருதத்தைச் சொல்லலாம். உயர் ஆய்வுகளில் தமிழ், வடமொழி இரண்டுமே ரோமன் எழுத்தில் எழுதப்படுகிறது. பல ஆயிரம் புத்தகங்கள் இருக்கின்றன. 

அறபி எழுத்தில் தமிழ் எழுதப்பட்டிருக்கிறது. தமிழ் பிராமியில் இருந்து சமணர்கள் வளர்த்தெடுத்த வட்டெழுத்து கைவிடப்பட்டு, சோழ மன்னர்கள்
இன்றைய தமிழ் எழுத்துக்கு கிரந்த்த எழுத்தைப் பயன்படுத்தத் தொடங்கினர். அதனால் தான் திராவிட மெய் 18, ஆரிய மெய் 5-மாக இன்றைய கணித் தமிழ் எழுத்துகள் உலகில் நிலைத்துவிட்டன.

உலகின் க்லாஸிக்கல் பாஷைகள் எல்லாம் பல எழுத்துகளில்
எழுதப்படுகிறது. கிரேக்க மொழி பண்டைய கிரேக்க லிபியிலும், ரோமானிய லிபியிலும் எழுதுவது நடைமுறை. இந்திய மொழிகளை
ஐஎஸ் ஓ 15919-ல் எழுதுவது எல்லா இந்திய மொழிகளுக்கும் இடையே உள்ள பரஸ்பர உறவுகளை எளிதில் புரிந்துகொள்ள வகையில்லாமல் செய்கிறது. உ-ம்: மலையாளமோ, தெலுங்கோ, கன்னடமோ ரோமனில் எழுதும்போது, தமிழர்க்கு ஓரளவு எளிதாகப் புரிந்துவிடும்.

ரீஜனல் எழுத்துகள் - ஹிந்தி உள்பட - அரசியலுக்கு மிகத் தேவை. சுருங்கிவரும் உலகில், இந்திய மொழிகளை ரோமனில் எழுதவும் வேண்டும்.
ரவி அண்ணாசாமி, த. சீனிவாசன் போன்றோர், வீதிகளில் உள்ள ஹிந்தி எழுத்துப் பலகைகளை கூகுள் ஆண்டிராய்ட், ஆப்பிள் ஐபோன்க்ளிலோ படமெடுத்தால் உடனே ஐஎஸ்ஓ 15919 வழியாக ரோமனில் காட்டும் அப்ஸ் தயார்செய்ய வேண்டுகிறேன். 

மத்திய அரசாங்கம் ஹிந்தியில் ரயில்களில், ரயில் நிலையங்களில், மைல்கற்களில், மத்திய சர்க்கார் அலுவலக விண்ணப்பங்கள் போன்றன வெறும் ஹிந்தியில் தயார் செய்யாமல், அதற்கான ஐஎஸ்ஓ 15919 ரோமன் எழுத்திலும் அச்சிட வேண்டும்.

ஏராளமான மொழிகள் உள்ள இந்தியாவில் ஆங்கில மொழிக்கும் இடமுண்டு என்றார் அண்ணாதுரை.
அதேபோல, ஏராளமான எழுத்துகள் உள்ள - வடிவத்தில் தான் வேறு, அடிப்படை ஒன்றே - இந்தியாவில்
ஆங்கில எழுத்து (ஐஎஸ்ஓ 15919) மூலம் எழுதுவதற்கும் இடமுண்டு. மக்களிடையே புரிந்துணர்வு பெருக ஒருவழி.
ஹிந்தி திணிப்பு என்பதே ஹிந்தி எழுத்தை பரவலாக்கம் என்று நினைப்போர் பலருண்டு.
ஐஎஸ்ஓ 15919 அதற்கு ஒரு தீர்வைக் காட்டும். 

நா. கணேசன்
 

- hide quoted text -
On Thu, 4 Jul, 2019, 16:03 N. Ganesan, <naa.g...@gmail.com> wrote:
- hide quoted text -
அன்பின் ரவி,

இந்தியாவில் மொழிகள் தங்கள் ரீஜனல் எழுத்துக்களோடு, ரோமானிய்/ஆங்கில எழுத்துமுறையும் பரவினால் நன்று. மாநிலங்களுக்கிடையே பயணம் செய்வோருக்கும், மொழிகளைக் கற்க விரும்புவாருக்கும் மிக உதவும்..

இதற்கான ஐஎஸ்ஓ தரப்பாடு: 

If you convert via Aksharamukha:
  நீ எப்படி இருக்கிறாய்? என்ன செய்யப்போகிறாய்? மொழிக்கும் மண்ணுக்கும் மக்களுக்கும்? 
==
  nī eppaṭi irukkiṟāy? eṉṉa ceyyappōkiṟāy? moḻikkum maṇṇukkum makkaḷukkum?  

In India, scripts are major political item, and many do not know all of their scripts derive from the same source: Brahmi script
and diverged in glyph shapes. In addition to regional scripts, an ISO 15919 transliteration will help in a big way.
Imposition of any one script on other people does not make sense. C. N. Annadurai said English language must be retained
in India as it is equidistant from all of India's languages. Same is true of English script, & more and more are learning English.
Distances are shrinking, thanks to Technology.

N. Ganesan

--------- Forwarded message ---------
From: Ravi Annaswamy <ravi.annaswamy@gmail.com>

I see your point. For a Telugu person to read a Tamil word in railway board or national highway, Roman script should be the transliteration option  not Hindi. Roman will serve global visitors too.

Regarding the script converter aksharamukha shared by you that is totally fantastic work.

Which Roman choice would you recommend?
I tried all and felt the most natural writable and readable of the choices was itrans. Let me know your recommendation?

Input Tamil 
நீ எப்படி இருக்கிறாய்? என்ன செய்யப்போகிறாய்? மொழிக்கும் மண்ணுக்கும் மக்களுக்கும்?

Roman itrans
nI ^eppaTi irukkiRAy? ^e^n^na ch^eyyappokiRAy? m^ozhikkum maNNukkum makkaLukkum?

Like it except for the carrots.
I see carrots for குறில் marking and  நன
I think a practical fluent system should only use a-zA-Z

Ps: I did not try copy pasting a Unicode text from a webpage, into input box but typed this myself, but I don’t see why that won’t work too.

Thank you
Ravi



Fantastic app

Which Roman would U recommend Sir?

Sent from my iPhone

-- 
"Tamil in Digital Media" group is an activity of Tamil Heritage Foundation. Visit our website: http://www.tamilheritage.org; you may like to visit our Muthusom Blogs at: http://www.tamilheritage.org/how2contribute.html To post to this group, send email to minT...@googlegroups.com
To unsubscribe from this group, send email to minTamil-unsubscribe@googlegroups.com

For more options, visit this group at http://groups.google.com/group/minTamil

வேந்தன் அரசு

unread,
Jul 4, 2019, 10:07:59 AM7/4/19
to vallamai


வியா., 4 ஜூலை, 2019, முற்பகல் 6:59 அன்று, N. Ganesan <naa.g...@gmail.com> எழுதியது:
On Thu, Jul 4, 2019 at 8:03 AM Pandiyaraja Paramasivam <pipi...@gmail.com> wrote:
நான் தமிழ் மொழிக்கான ஆய்வினை மட்டும் தான் மேற்கொண்டேன். புள்ளிகளையும் கணக்கில் எடுத்துக்கொண்டேன். தமிழ் மொழியை எழுதுவதற்கு ரோமன் லிபி முற்றிலும் சரியானதல்ல.

உங்கள் ஆய்வை சம்ஸ்கிருதம் அல்லது  ஹிந்தி எழுத்துக்கு மேற்கொண்டால் அப்படியே பொருந்திவரும். மேலும், ஹிந்தி எழுத்து மிக காம்பேக்ட்.
எழுத்துருவின் ஒரே அளவில் ஒரு வாக்கியத்தை எழுதிப்பார்த்தால் தெரியும். அதனால், ரோமன் லிபியில் செம்மொழி தமிழோ, வடமொழியோ எழுதக்கூடாது என்று முடிவு கூற முடியாது. தமிழ் எழுத்தே தெரியாத தமிழ்ப் பெற்றோருக்குப் பிறந்த குழந்தைகள் பல லட்சக்கணக்கில் வளர்ந்து வருகின்றனர் உலகெங்கும். மொழிதான் முக்கியமே தவிர, எழுதப்படும் லிபி அதற்கு ஒரு கருவிதான். 

மலேசியா, இந்தோனேசியா, துருக்கி, ... அமெரிக்க இந்திய மொழிகள், ஆப்பிரிக்க மொழிகள், ஐரோப்பிய மொழிகள், .... என்று ஏராளமான
மொழிக்குடும்பங்களை எழுதுகிர ஒரே எழுத்து ரோமன் எழுத்து தான். அதில் இந்திய மொழிகளும், சொந்த பிராமிவழி எழுத்துக்களுடன்
எழுதப்படவேண்டும். அவ்வாறு எழுதினால், உடனே புரியும். உ-ம்: திராவிட மொழிக் குடும்பத்தாரை எடுத்துக்கொள்வோம். ஒன்றுக்கொன்று
உடனே புரியும்.

Uṅkaḷ āyvai camskirutam allatu hinti eḻuttukku mēṟkoṇṭāl appaṭiyē poruntivarum. Mēlum, hinti eḻuttu mika kāmpēkṭ. Eḻutturuviṉ orē aḷavil oru vākkiyattai eḻutippārttāl teriyum. Ataṉāl, rōmaṉ lipiyil cem'moḻi tamiḻō, vaṭamoḻiyō eḻutakkūṭātu eṉṟu muṭivu kūṟa muṭiyātu. Tamiḻ eḻuttē teriyāta tamiḻp peṟṟōrukkup piṟanta kuḻantaikaḷ pala laṭcakkaṇakkil vaḷarntu varukiṉṟaṉar ulakeṅkum. Moḻitāṉ mukkiyamē tavira, eḻutappaṭum lipi ataṟku oru karuvitāṉ. Malēciyā, intōṉēciyā, turukki, ... Amerikka intiya moḻikaḷ, āppirikka moḻikaḷ, airōppiya moḻikaḷ, .... Eṉṟu ērāḷamāṉa moḻikkuṭumpaṅkaḷai eḻutukira orē eḻuttu rōmaṉ eḻuttu tāṉ. Atil intiya moḻikaḷum, conta pirāmivaḻi eḻuttukkaḷuṭaṉ eḻutappaṭavēṇṭum. Avvāṟu eḻutiṉāl, uṭaṉē puriyum. U-m: Tirāviṭa moḻik kuṭumpattārai eṭuttukkoḷvōm. Oṉṟukkoṉṟu uṭaṉē puriyum

 
வேந்தன் அரசு
வள்ளுவம் என் சமயம்

N. Ganesan

unread,
Jul 4, 2019, 10:47:59 AM7/4/19
to வல்லமை
On Thursday, July 4, 2019 at 9:04:14 AM UTC-5, Pandiyaraja wrote:
If you count the number of characters used, Roman script for Tamil would require more characters and the average word length would be larger. I have proved this taking more than 2,50,000 words in Tamil.

I think you are counting both independent and dependent letters as independent characters. You counting will hold good for all of India's scripts. In fact, conjunct letters if taken as single units will yield a much smaller number compared with Roman.

But visually, Tamil script occupies more space than Hindi, Roman etc.,(for the same font size).


இந்தியாவின் தேசிய கீதம்

Jana-gaṇa-mana adhināyaka jaya hē Bhārata-bhāgya-vidhātā.
Paṁjāba-Sindhu-Gujarāta-Marāṭhā, Drāviṛa-Utkala Baṁga
Viṁdhya[c] Himācala Yamunā Gaṁgā, ucchala jaladhi taraṁga
Taba[d] Śubha nāmē jāgē, taba[e] śubha āśiṣa māṁgē
gāhē taba[e] jaya gāthā.
Jana gaṇa maṁgala-dāyaka jaya hē, Bhārata bhāgya vidhātā.
Jaya hē, Jaya hē, Jaya hē, jaya jaya jaya jaya hē.

ஜன-க³ண-மன அதி⁴நாயக ஜய ஹே பா⁴ரத-பா⁴க்³ய-விதா⁴தா.
பஞ்ஜாப³-ஸிந்து⁴-கு³ஜராத-மராடா², த்³ராவிட²-உத்கல ப³ங்க³
விந்த்⁴ய ஹிமாசல யமுனா க³ங்கா³, உச்ச²ல ஜலதி⁴ தரங்க³
தப³ ஶுப⁴ நாமே ஜாகே³, தப³ ஶுப⁴ ஆஶிஷ மாங்கே³
கா³ஹே தப³ ஜய கா³தா².
ஜன க³ண மங்க³ல-தா³யக ஜய ஹே, பா⁴ரத பா⁴க்³ய விதா⁴தா.
ஜய ஹே, ஜய ஹே, ஜய ஹே, ஜய ஜய ஜய ஜய ஹே.

(இந்தியாவின் நாட்டுப்பண்ணை எழுத ஆர்ய அக்ஷரங்கள் தேவைப்படுகின்றன.)
 

On Thu, 4 Jul, 2019, 19:21 N. Ganesan, <naa.g...@gmail.com> wrote:


On Thursday, July 4, 2019 at 8:00:46 AM UTC-5, N. Ganesan wrote:
On Thu, Jul 4, 2019 at 6:37 AM Pandiyaraja Paramasivam <pipi...@gmail.com> wrote:
In my Ph.D thesis I have established that the Roman script is most unsuitable for Tamil. It makes the average word length longer, the main reason being that Tamil script uses the concept of உயிர்மெய் எழுத்துக்கள்.
Even in the example cited here, one can notice that the Tamil version requires less than 40 characters while the Roman script version requires more than 60 characters.
P.Pandiyaraja


As a mathematician you are counting Uyirmey as separate characters. But are they? For example, Nannul calls them as "cArpu ezuttu" - dependent letters.

இதற்கான ஐஎஸ்ஓ தரப்பாடு: 

If you convert via Aksharamukha:
  நீ எப்படி இருக்கிறாய்? என்ன செய்யப்போகிறாய்? மொழிக்கும் மண்ணுக்கும் மக்களுக்கும்? 
==
  nī eppaṭi irukkiṟāy? eṉṉa ceyyappōkiṟāy? moḻikkum maṇṇukkum makkaḷukkum? 

why is Tamil script longer than Roman script writing? which is more efficient?

N. Ganesan

-- 
Reply all
Reply to author
Forward
0 new messages