கணினியும் தமிழும்—முனைவர் ப. பாண்டியராஜா

28 views
Skip to first unread message

தேமொழி

unread,
Nov 9, 2025, 12:18:10 PM (5 days ago) Nov 9
to மின்தமிழ்
கணினியும் தமிழும்

—முனைவர் ப. பாண்டியராஜா

கணினி வழியாகத் தமிழ் இலக்கியங்களுக்கான தொடரடைவுகளை நான் உருவாக்கிக்கொண்டு வருவதைப் பலரும் அறிவீர்கள். கணினியின் உதவியில்லாமல் மனித முயற்சியால் அதனைச் செய்வது ஏறக்குறைய முடியாத காரியம் ஆகும்.

ஒரு சொல்லைக் கணினி வழியாகத் தேடவேண்டுமானால், அச்சொல் ஒரு தொடரில் முழுமையாக இருக்கவேண்டும்.

ஆனால் தமிழில் புணர்ச்சிவிதிகளால் ஒரு சொல்லின் எழுத்துக்கள் மாறிவிடுகின்றன.  பல்நோய், பல்மருத்துவர், பன்னாட்டு நிறுவனம், பற்சிதைவு - ஆகியவற்றில் உள்ள பல் என்ற பகுதியைக் கணக்கிட முடியாது.

சங்க இலக்கியங்களில் இசின் என்ற ஒரு சொல் அடிக்கடி பயன்படுத்தப்படுகிறது.

வந்திசின், சென்றிசினோரே, கண்டிசினே ,,  இப்படிப் பலவகைகளில் இந்த இசின் சொற்களில் ஒளிந்துகொண்டிருக்கிறது. இதைக் கணினி மூலம் கணக்கிடுவது எப்படி?

நான் 2001-இல் ஓய்வுபெற்ற புதிதில் கணினி வழியாகத் தமிழ் இலக்கியங்களை ஆய்வதற்கு ஒரு மென்பொருள் உருவாக்கவேண்டும் என்று முனைப்புடன் செயல்பட்டேன். ஒரு மென்பொருளையும் உருவாக்கினேன். அந்த மென்பொருளுக்கு கணியன் என்றும் பேரிட்டேன். அதன் சில பகுதிகளைக் கீழே படமாகக் கொடுத்துள்ளேன்.

அதில் ஒரு பகுதிதான் சொல் தேடல். இதற்கு நான் எழுதிய Program ஒரு தமிழ்ச் சொல்லை ஆங்கில எழுத்துக்களாக மாற்றும். தேடவேண்டிய சொல்லையும் ஆங்கில எழுத்தாகப் பெறும்.

அப்புறம் என்ன? எல்லாம் எளிதில் முடிந்துவிடும்.

நான் முன்பு குறிப்பிட்ட இசின் வரும் சொற்கள் இவ்வாறு மாற்றப்படும்.
va^ticin, cenRicinOrE, kaNdicinE .  
இப்போது இதில் தேடவேண்டிய சொல் icin.
பாருங்கள், ஒவ்வொரு சொல்லிலும் இந்த icin துணுக்காக இருக்கிறது.
கணினி எளிதில் கண்டிபிடித்துக் கொடுத்துவிடும்.

பின்னர் இவ்வாறு ஆங்கில எழுத்துக்களில் உள்ளவற்றை மீண்டும் தமிழில் மாற்றிக் கொடுத்துவிடும்.

சொல்லப்போனால், இவ்வாறு தொடங்கியதுதான் என் தொடரடைவு உருவாக்க முயற்சி.

பழைய நினைவுகளைத் தூண்டிவிட்டதற்கு அன்பர் அருள் மெர்வின் அவர்களுக்கு மிக்க நன்றி.
அவரின் பாராட்டுரைகளுக்கும் மிக்க நன்றி.


code1.jpg

code2.jpg

code3.jpg
__________________________________________
​​​​​​​​​​​​​​​​​​​​​​

Pandiyaraja Paramasivam

unread,
Nov 9, 2025, 12:51:15 PM (5 days ago) Nov 9
to mint...@googlegroups.com
மிக்க நன்றி, தேமொழி அம்மையே.
ப.பாண்டியராஜா

--
"Tamil in Digital Media" group is an activity of Tamil Heritage Foundation. Visit our website: http://www.tamilheritage.org; you may like to visit our Muthusom Blogs at: http://www.tamilheritage.org/how2contribute.html To post to this group, send email to minT...@googlegroups.com
To unsubscribe from this group, send email to minTamil-u...@googlegroups.com
For more options, visit this group at http://groups.google.com/group/minTamil
---
You received this message because you are subscribed to the Google Groups "மின்தமிழ்" group.
To unsubscribe from this group and stop receiving emails from it, send an email to mintamil+u...@googlegroups.com.
To view this discussion visit https://groups.google.com/d/msgid/mintamil/e331a395-8c4e-4bb5-88d9-3d4c01426410n%40googlegroups.com.

தேமொழி

unread,
Nov 9, 2025, 8:09:55 PM (5 days ago) Nov 9
to மின்தமிழ்
🙏🙏 ஐயா

தேமொழி

unread,
Nov 9, 2025, 8:18:27 PM (5 days ago) Nov 9
to மின்தமிழ்
இக்கட்டுரையைப் படித்தாலே பாண்டியராஜா ஐயாவின் தொழில் நுட்ப உதவியின் மேன்மை புரியும் 
​​​​​​​​​​​​​​​​________________________________
அருள் மெர்வின்

இசின்
எழுதும்போது ஒரு வாக்கியத்தில் எந்த சொல்லையாவது ஹைலைட் செய்து காண்பிக்க வேண்டுமென்றால் ஹைலைட்டர் உபயோகிக்கலாம். அல்லது, “…”க்குள் போட்டு அடைக்கலாம். இரண்டாயிரம் மூவாயிரம் ஆண்டுகளுக்கு முன் எழுத்தாணியை வைத்து இப்படியெல்லாம் ஓலையைக் கிழித்துக் கொண்டிருக்க முடியாது. ஒருவேளை கோடுகள், கோலங்கள் போட்டு ஹைலைட் செய்தாலும் அவற்றை வாசித்துக் காட்டும் போது எப்படி ஹைலைட் செய்ய முடியும்? உதாரணமாக:
ஒன்றே குலம் “ஒருவன்” தலைவன்.
எழுதும் போது ஒருவனை “…”க்குள் போட்டு ஹைலைட் செய்தாகிவிட்டது. இதை வாசித்துக் காட்டும் போது ஒருவன் என்ற சொல்லுக்குக் காற்றில் கோலம் போட்டு ஹைலைட் செய்தால் காமெடியாக இருக்கும். (பலபேர் அதையும் இரண்டு விரல்களை வைத்து quote, unquote என்று ஸ்டைலாகக் காண்பிக்கிறார்கள்.) அல்லது, ஒன்றே குலம் வரை லோ பிட்சில் வாசித்து விட்டு ஒருவன் என்று வந்தவுடன் ஹை பிட்சில் குரலை உயர்த்தலாம். அது இன்னும் காமெடியாக இருக்கும்.
இந்த பிரச்சனையைத் தீர்க்க தமிழ் தன்னுள்ளே கொண்டுள்ள தீர்வு ஆச்சரியமானது. சிம்பிள்.
ஒன்றே குலம் ஒருவனே தலைவன்.
ஒருவனுக்குப் பின்னால் ‘ஏ’ஐப் போட்டுவிட்டால் போதுமானது. ஹைலைட்டர் எல்லாம் உபயோகிக்காமல் ஏ என்ற எழுத்தைச் சேர்த்து அந்த ஒருவனை எழுத்தை மட்டுமே வைத்து ஹைலைட் செய்ய முடிகிறது. இதை வாசிக்கும் போதும் அந்த ஒருவனை ஏ போட்டு இழுத்துக் குரலை உயர்த்துவது எளிது. இது போன்ற வசதி பல மொழிகளில் கிடையாது. பேசுபவர்தான் ஹே, ஹோ போட்டு அங்கங்கே குரலை உயர்த்த வேண்டும்.
இந்த ‘ஏ’ போடுவதை இலக்கணத்தில் ‘இடைநிலைச் சொல்’ என்ற வகையில் சேர்க்கிறார்கள். தமிழில் இப்படி ஏகப்பட்ட இடைநிலைச் சொற்கள் உள்ளன. அவற்றில் ஏகப்பட்ட கிளைகள் உள்ளன. “ஒருவன் தலைவன்” என்ற வாக்கியத்தின் இடையே ஓர் ஏ-ஐப் போட்டு “ஒருவனே தலைவன்” என்று சொல்வது ‘தேற்றம்’ என்ற கிளையைச் சார்ந்தது. அதாவது, தெளிவு படுத்துதல். அந்த ஒருவன் தலைவன், அதே சமயம் அந்த ஒருவன் மட்டும்தான் தலைவன் என்று ஹைலைட் செய்து தெளிவுபடுத்துவது. அந்த வகையில் “ஒன்றே குலம், ஒருவனே தேவன்” என்பது இலக்கணப்படி, ஏதோ ஒரே ஒரு குலத்துக்கு ஒரு கடவுளை மட்டுமே ஹைலைட் செய்வது.
இந்த ‘தேற்றம்’ கிளையின் கீழ் ஒரு சொல் ஹைலைட் செய்யப்பட்ட இன்னொரு பிரபல வாக்கியம், யாதும் ஊரே. “யாதும் ஊர்” அல்ல. “யாதும் ஊரே”!
தமிழில் இடைநிலைச் சொல் என்பது ஒரு கடல். இவற்றை ஏன் இடைநிலைச் சொற்கள் என்கிறார்கள் என்றால் இந்த ‘ஏ’ போன்ற சொற்களுக்குத் தனியே அர்த்தம் கிடையாது. (அசைச் சொற்கள் என்றும் இவை போன்றவற்றை அழைக்கிறார்கள். சும்மா அங்கங்கே அசைந்து கொண்டிருக்கும் சொற்கள்.) இந்த இடைச் சொற்கள்தான் தமிழின் முதுகெலும்பு. இவையில்லாமல் தமிழில்லை. ‘கொடு’ என்பது ஒரு சாதாரண வினைச் சொல். இதற்குக் காலம் கிடையாது. இதை இறந்த காலமாக்க ‘கொடுத்தான்’ என்று ஓர் ‘ஆன்’ கடைசியில் சேர்க்க வேண்டும். நிகழ்காலமாக்க? ‘கொடுக்கிறான்’ என்று ‘ஆன்’ சேர்க்க வேண்டும். வருங்காலமாக்க? ‘கொடுப்பான்’ என்று ‘ஆன்’ சேர்க்க வேண்டும். யோசித்துப் பாருங்கள். ‘ஆன்’ சேர்ப்பதால் இந்த சொல்லின் காலம் தீர்மானிக்கப்படுவதில்லை. ‘கொடு’ - ‘ஆன்’ இந்த இரண்டுக்கும் இடையே புதிய சில சொற்கள் நுழைகின்றன. த்+த், கிறு, ப்… நடுவே வந்து விழுந்து காலத்தைத் தீர்மானிக்கின்றன. இவையும் இடைநிலைச் சொற்கள். இவற்றை இறந்தகால வினை இடைநிலை (த்+த்), நிகழ்கால வினை இடைநிலை (கிறு), எதிர்கால வினை இடைநிலை (ப்) என்று கிளைகளாக வகைப்படுத்துகிறார்கள்.
‘இசின்’ என்று தலைப்பு வைத்துவிட்டதால் அசின், பிசின் என்று ஏதாவது சுவாரசியமாக இருக்குமோ என்று வாசிக்க ஆரம்பித்து இலக்கண வகுப்பில் மாட்டிக் கொண்டிருக்கிறீர்கள் என்று நன்றாகத் தெரிகிறது. இடைநிலைச் சொற்கள் தமிழின் முதுகெலும்பாக இருந்தாலும் தமிழில் நாம் இழந்துவிட்ட இடைநிலைச் சொற்கள் ஏகப்பட்ட உள்ளன. சங்க இலக்கியங்களை வாசிக்கும் போது அழிந்து போன இந்த இடைநிலைச் சொற்கள் பிசின் போல வந்து ஒட்டிக்கொள்ளும். அதில் ஒன்றுதான் ‘இசின்’.
ஐங்குறுநூறு பற்றித் தொடர்ந்து எழுதிக் கொண்டிருப்பதால் அதிலிருந்தே ஓர் உதாரணம். “கேட்டிசின் வாழியோ மகிழ்ந…” என்று ஆரம்பிக்கிறது ஒரு பாடல். கேட்டிசின். இதில் வரும் வினைச் சொல் புரிகிறது. ‘கேள்’ என்பது. ‘கேட்டிசின்’ என்றால் என்ன அர்த்தம்? யாருக்கும் தெரியாது என்பதுதான் கள நிலவரம். இந்த இசினை ‘இறந்தகால இடைநிலை’ என்ற வகையில் சேர்த்திருக்கிறார்கள். அதாவது, ‘கேட்டிசின்’ என்றால் ஏதோ கடந்த காலத்தில் கேட்டது சம்பந்தப்பட்டது. இது ‘இசின்’ இல்லை, வெறும் ‘சின்’ என்று ஒரு ட்விஸ்ட் வைக்கிறார் தொல்காப்பியர். அதுவும் அவருக்கு முந்தைய காலத்திலிருந்தே புழக்கத்திலிருந்த தொன்மையான இடைநிலைச் சொல் என்கிறார். ஓர் ஆதிகாலத் தமிழ் இடைநிலைச் சொல் இந்த இசின்/சின்.
நான்: “ஹலோ ஹலோ… நான் பேசுறது கேட்டுச்சா?”
மனைவி: “கேட்டுச்சினா மட்டும்…?”
கேட்டிசின். 

தேமொழி

unread,
Nov 9, 2025, 8:26:34 PM (5 days ago) Nov 9
to மின்தமிழ்
அருள் மெர்வின்

இசின் - பாகம் 2
வாழ்க்கை என்பது என்ன? அகன்று அடைந்து அயர்ந்து அறிந்து அன்று ஆண்டு ஆய்ந்து ஆற்று ஆன்று இறந்து உடற்று உணர்ந்து உயர்ந்து உரைத்து உவந்து உற்று உறைந்து என்று கண்டு காண்டு கூர்ந்து கேட்டு சிறந்து சென்று சூழ்ந்து தெரிந்து தெளிந்து நடந்து நய்ந்து நயந்து நிழற்று நுவன்று நோற்று படர்ந்து படைத்து பயந்து பிரிந்து புகழ்ந்து புணர்ந்து பூண்டு பெற்று போன்று மருண்டு மறந்து மறுத்து மாய்ந்து மிளிர்ந்து முந்து வடித்து வந்து வலித்து வளர்ந்து… முடிவது?
—-
‘இசின்’ எங்கெல்லாம் சங்க இலக்கியங்களில் வருகிறது என்று கண்டுபிடிப்பது மிகச் சிக்கலானது. Ctrl+F ‘இசின்’ என்று போட்டு அதைத் தேடமுடியாது. ஏனென்றால் இசினைப் பதம் பிரித்து எழுதியிருக்கமாட்டார்கள். ஓடினான் என்பதை ஓடு இன் ஆன் என்று பிரித்து அச்சிட்டிருக்க மாட்டார்கள். அதனால், ‘ஆன்’ எங்கெல்லாம் வருகிறது என்று Ctrl+F ‘ஆன்’ போட்டுத் தேடமுடியாது. அதேபோல கேட்டிசின் என்பதை கேள் ட் இசின் என்று பதம் பிரித்திருக்க மாட்டார்கள். இசின் என்பது தனிச் சொல் அல்ல. அதைப் பிரித்தால் அதற்கு எந்த அர்த்தமும் கிடையாது. அது கேட்டிசின், மறந்திசின் என்று எங்கேயாவது பிசின் போல ஒட்டிக்கொண்டிருக்கும். ‘சின்’ என்று போட்டுத் தேடினால் அஞ்சின், நெஞ்சின், முரசின் என்று இசினுக்குச் சம்பந்தமில்லாத ஏகப்பட்ட வார்த்தைகளும் கூடவே வந்து விழும். அப்படியே Ctrl+F ‘சின்’ போட்டுத் தேடுவதிலும் சிக்கல் உள்ளது.
இசினில் முடியும் வார்த்தைகளுடன் ஆல், ஏ, ஓர் போன்ற இன்னும் சில இடைச் சொற்கள் ஒட்டிக் கொண்டு அயர்ந்திசினால் (அயர்ந்து+இசின்+ஆல்), உற்றிசினே (உற்று+இசின்+ஏ), சென்றிசினோர் (சென்று+இசின்+ஓர்) என்றெல்லாம் முடிகிறது. அப்படியே முடிந்துவிட்டாலும் பரவாயில்லை. அதன்பின் ஏ, க்கும், உம் போன்ற இன்னொரு செட் இடைநிலைச் சொற்கள் வந்து ஒட்டிக்கொண்டு இறந்திசினோரே (இறந்து+இசின்+ஓர்+ஏ), உறைந்திசினோர்க்கும் (உறைந்து+இசின்+ஓர்+க்கும்), நயந்திசினோரும் (நயந்து+இசின்+ஓர்+உம்) என்று தொடுத்திருக்கிறார்கள் சங்கப் புலவர்கள். அதுவும் போதாதென்று இறந்திசினோளே, புகழ்ந்திசினோனே என்று பெண்பால், ஆண்பால் வேற்றுமைகளையெல்லாம் புகுத்தித் தங்கள் திறமையைக் காண்பித்திருக்கிறார்கள். Ctrl+F ‘சி’ போட்டுத் தேடவேண்டும். அது ரசத்தில் புளியைத் தேடுவது போலாகிவிடும்.
சங்க இலக்கியங்களில் ‘இசின்’ எங்கெல்லாம் வருகிறது என்று கண்டுபிடிப்பதிலுள்ள சிக்கலை ஒரே நொடியில் தீர்த்துவைத்துவிட்டார் முனைவர் பாண்டியராஜா! தமிழார்வமும் வேண்டும் அதே சமயம் விஞ்ஞானமும் தெரிந்திருக்க வேண்டும் என்பதற்கு அப்துல் கலாம் வரையெல்லாம் செல்ல வேண்டியதில்லை. நாம் வாழும் சமகாலத்தில் நமக்குக் கிடைத்த வரம் முனைவர் பாண்டியராஜா. ப்ரெயில் போல சங்க இலக்கியங்களைத் தட்டித்தடவி வாசித்து எழுதிக் கொண்டிருக்கும் என் முந்தைய பதிவை வாசித்து விட்டு, “இசின்தானே, இந்தா… பிடி”, என்று கம்பயூட்டரில் மந்திரம் போட்டு சங்க இலக்கியங்களில் எங்கெல்லாம் இசின் உபயோகப்படுத்தப்பட்டிருக்கிறது என்று பட்டியலிட்டுக் கொடுத்துவிட்டார். நூற்றுக்கும் மேற்பட்ட இடங்களில் இசின் உபயோகப்படுத்தப்பட்டிருக்கிறது. ஐம்பதுக்கும் மேற்பட்ட விதவிதமான சொற்களுடன் ஒட்டி வைக்கப்பட்டிருக்கிறது. நாமெல்லாம் தமிழை நேசிக்கிறோம். முனைவர் பாண்டியராஜாவைத் தமிழ் நேசிக்கிறது.
இலக்கணப் புத்தகங்களுடனெல்லாம் புரண்டு படித்தாலும் ‘இசின்’ பற்றி பளிச்சென்ற ஒரு புரிதலுக்கு வருவது மானுடராகப் பிறந்தவர்களுக்கு இயலாதது. சங்ககால மக்கள் வினைச் சொற்களுடன் இணைத்து உபயோகித்த ஓர் இடைச் சொல் ‘இசின்’. இசினை எந்த அர்த்தத்தில் உபயோகித்திருக்கிறார்கள்? அருஞ்சொற்கள் வழக்கொழிந்து விட்டால் அவற்றின் அர்த்தங்களை ஓரளவு யூகித்துவிடலாம். இசின் போன்ற இடைச் சொற்கள் வழக்கொழிந்து விட்டால் சங்ககாலத்துக்கு டைம் ட்ராவல் செய்து அவர்கள் பேசுவதை நேரில் கேட்டால்தான் சப்டைட்டில் கிடைக்கும். நூற்றுக்கணக்கான இடங்களில் வரும் இந்த இசினைப் புரிந்து கொள்ளாமல் சங்க இலக்கியங்களை வாசித்துப் புரிந்து கொள்வது போக்குவரத்துக் குறியீடுகளின் அர்த்தம் தெரியாமல் கார் ஓட்டுவது போன்றது.
முதல் பத்தியில் பட்டியலிட்டது சங்க இலக்கியங்களில் இசின் இணைந்திருக்கும் வார்த்தைகள்!
அகன்றிசின், அடைந்திசின், அயர்ந்திசின், அறிந்திசின், அன்றிசின், ஆண்டிசின், ஆய்ந்திசின், ஆற்றிசின், ஆன்றிசின், இறந்திசின், உடற்றிசின், உணர்ந்திசின், உயர்ந்திசின், உரைத்திசின், உவந்திசின், உற்றிசின், உறைந்திசின், என்றிசின், கண்டிசின், காண்டிசின், கூர்ந்திசின், கேட்டிசின், சிறந்திசின், சென்றிசின், சூழ்ந்திசின், தெரிந்திசின், தெளிந்திசின், நடந்திசின், நய்ந்திசின், நயந்திசின், நிழற்றிசின், நுவன்றிசின், நோற்றிசின், படர்ந்திசின், படைத்திசின், பயந்திசின், பிரிந்திசின், புகழ்ந்திசின், புணர்ந்திசின், பூண்டிசின், பெற்றிசின், போன்றிசின், மருண்டிசின், மறந்திசின், மறுத்திசின், மாய்ந்திசின், மிளிர்ந்திசின், முந்திசின், வடித்திசின், வந்திசின், வலித்திசின், வளர்ந்திசின்.
சங்க இலக்கியங்களில் அடிக்கடி தலைகாட்டி அதிகம் ஸ்கோர் செய்யும் வார்த்தைகள்… ஆன்றிசின், உரைத்திசின், கண்டிசின், கேட்டிசின், பிரிந்திசின், வந்திசின். உணர்வது, பேசுவது, காண்பது, கேட்பது, பிரிவது, இணைவது!
“தேமொழி அரிவை தெளிந்திசின் யானே”
இனிய மொழி கொண்ட பெண் தெளிந்து___ யானே!
இசின்… தெளிந்திசின் யானே.
Reply all
Reply to author
Forward
0 new messages