Re: Tamil Spellchecker

75 views
Skip to first unread message

Elanjelian Venugopal

unread,
Sep 12, 2011, 12:35:18 AM9/12/11
to freetamil...@googlegroups.com
Dear All:

Please find attached two basic files that I've created to test the spellchecking concept. It is based on recommended method found here: http://lingucomponent.openoffice.org/dictionary.html . Note that I've only considered nouns in my test file.

Could someone test these files using Hunspell, which is found here: http://sourceforge.net/projects/hunspell/files/

Documentation on Hunspell is here: http://sourceforge.net/projects/hunspell/files/Hunspell/Documentation/

Please advise your progress.

Best regards,
Elanjelian
ta_IN.aff
ta_IN.dic

Muguntharaj Subramanian

unread,
Sep 13, 2011, 10:29:45 AM9/13/11
to freetamil...@googlegroups.com
Vanakkam Elanjelian,

I compiled hunspell in my linux machine  tried these files in hunspell.

They dont seem to work.

Here is the input text I gave:
புகைப்படம் ஆடு sss இந்த

Output got:


ப்படம்
ஆட
sss
இந்த

Meaning - it shows the above words as mispelled words.

I hunspell is not able to seperate the words & use affix file data correctly. I will dig into this further later and let you know my finding.

Regards,
Mugunth




--
You received this message because you are subscribed to the Google Groups "ThamiZha! - Free Tamil Computing(FTC)" group.
To post to this group, send an email to freetamil...@googlegroups.com.
To unsubscribe from this group, send email to freetamilcomput...@googlegroups.com.
For more options, visit this group at http://groups.google.com/group/freetamilcomputing?hl=en-GB.



--
Blog: http://mugunth.blogspot.com
Follow me @ http://twitter.com/mugunth

Elanjelian Venugopal

unread,
Sep 13, 2011, 1:24:00 PM9/13/11
to freetamil...@googlegroups.com, Yagnanarayanan
Mugunth & others, vanakkam.

First the good news: the AFF file works!

I'm dancing around my hall.... (to the constanation of my wife).


See the images of pre and post inclusion of AFF file. I got both the suffix and prefix working, individually and together. Works like a charm. Perfect!

OK, now the bad news: the suggestion bit, however, ... well, doesn't quite work.

In conclusion: we are onto something, so it's not some wild goose chase. Phew!

-e.
ta_IN-pre.jpg
ta_IN-post.jpg

Muguntharaj Subramanian

unread,
Sep 13, 2011, 8:06:54 PM9/13/11
to freetamil...@googlegroups.com
Hi Elanjelian,
Thats a great news. So we can hope to have an opensource intelligent spellchecker soon.

Please send the steps to test hunspell + tamil files + libreoffice . So that others also can test and help to refine the affx files.

Once we have a stable hunspell tamil files, we can start exploring bundling this spell checker in other applications. I will also explore bundling this spell checker in our ekalappai.

Regards,
Mugunth

Elanjelian Venugopal

unread,
Sep 13, 2011, 10:45:26 PM9/13/11
to freetamil...@googlegroups.com
Mugunth,

I used Open Office 2.4.2, instead of LibreOffice, for the testing. Reason: Libreoffice treats dictionaries as extensions; whereas in OO 2.4, the file are found in a folder.

Now the steps:

1. Download an OpenOffice 2.0.2 to 2.4.2 copy from here: http://www.oldapps.com/openoffice.php - and install

2. Go to the following folder, and Program Files\OpenOffice.org\share\dict\ooo

3. Open the following file using your favourite text editor: dictionary.lst

4. Insert the following line somewhere in the file: DICT ta IN ta_IN (I inserted it above DICT en US en_US ).

5. Drop the ta_IN dic and aff files (attached with this mail) into this same folder.

6. Start your OpenOffice now, and go to Tools > Options > Language Settings > Writing Aids > Available Language Modules

7. Highlight OpenOffice.org Hunspell SpellChecker, and click Edit... Make sure Tamil is listed there. If yes, you are set, and you may begin your testing.

8. So far I've tagged only the following words -- ஆடு, புகைப்படம், காடு, புயல், சந்தை. Suppose you want to tag other words, say, எலி. You could open look for the word in ta_IN.dic and add the tagging next to the word. Currently, the following labels are in use -- A, B, C, D, E, F, G, H, I, J, and K. The meaning of these labels are found in the ta_IN.aff file. You could also create more rules...

9. I don't know if Line 8 above makes sense, but to get a hang of the concept, mess with the files. Do your stuff. It's easy and, I suppose, fun!

Best, -e.
ta_IN.aff
ta_IN.dic

திவாஜி

unread,
Sep 13, 2011, 10:58:09 PM9/13/11
to freetamil...@googlegroups.com, tami...@gmail.com
:-)))
நான் ஓபன் ஆபீஸ் 3.2 பயனப்டுத்துகிறேன்.
ஆப்ஷனில் ஹன்ஸ்பெல் செக் இருக்கிறது. அதில் தமிழ் தேர்வு செய்துள்ளேன்.
வேலை செய்கிறதே!

On Wed, Sep 14, 2011 at 8:15 AM, Elanjelian Venugopal <tami...@gmail.com> wrote:
Mugunth,

I used Open Office 2.4.2, instead of LibreOffice, for the testing. Reason: Libreoffice treats dictionaries as extensions; whereas in OO 2.4, the file are found in a folder.

--
http://www.swaminathar.org/
http://aanmikamforyouth.blogspot.com/
http://techforelders.blogspot.com/

Screenshot-3.png

Muguntharaj Subramanian

unread,
Sep 14, 2011, 12:02:45 AM9/14/11
to freetamil...@googlegroups.com


2011/9/14 திவாஜி <agni...@gmail.com>

:-)))
நான் ஓபன் ஆபீஸ் 3.2 பயனப்டுத்துகிறேன்.
ஆப்ஷனில் ஹன்ஸ்பெல் செக் இருக்கிறது. அதில் தமிழ் தேர்வு செய்துள்ளேன்.
வேலை செய்கிறதே!

இங்க நாம் விவாதித்துக்கொண்டிருப்பது ஏற்கனவே உள்ள தமிழ் hunspell வசதி பற்றி அல்ல. அதில் வார்த்தை பட்டியல் மட்டுமே உள்ளது(ta_IN.aff file will empty in current hunspell distributions)
 
தற்பொது நாம் முயற்சிப்பது அதில் மேலும் வசதிகளை கூட்டுவது பற்றி. உதாரணம் அவன் என்ற வார்த்தை வைத்துக்கொண்டு, hunspellஐ -  அவனை , அவனுக்கு  போன்ற வார்த்தைகளை அடையாளம் காண வைக்க முடியும் . அதற்கான விதிகளை ta_IN.aff  என்ற hunspell  கோப்பில் கொடுக்கவேண்டும்(ta_IN.dic லும் மாற்றங்கள் செய்ய வேண்டும்)

இந்த hunspellஐ  மெருகூட்டும் முயற்சி யைப்பற்றித் தான் தற்போது விவாதித்திகொண்டிருக்கிறோம்.

நீங்களும் இதில் கலந்து கொள்ளவேண்டும்.

அன்புடன்,
முகுந்த்
 

On Wed, Sep 14, 2011 at 8:15 AM, Elanjelian Venugopal <tami...@gmail.com> wrote:
Mugunth,

I used Open Office 2.4.2, instead of LibreOffice, for the testing. Reason: Libreoffice treats dictionaries as extensions; whereas in OO 2.4, the file are found in a folder.

--
http://www.swaminathar.org/
http://aanmikamforyouth.blogspot.com/
http://techforelders.blogspot.com/

--
You received this message because you are subscribed to the Google Groups "ThamiZha! - Free Tamil Computing(FTC)" group.
To post to this group, send an email to freetamil...@googlegroups.com.
To unsubscribe from this group, send email to freetamilcomput...@googlegroups.com.
For more options, visit this group at http://groups.google.com/group/freetamilcomputing?hl=en-GB.

திவாஜி

unread,
Sep 14, 2011, 12:34:56 AM9/14/11
to freetamil...@googlegroups.com


2011/9/14 Muguntharaj Subramanian <mug...@gmail.com>

இங்க நாம் விவாதித்துக்கொண்டிருப்பது ஏற்கனவே உள்ள தமிழ் hunspell வசதி பற்றி அல்ல. அதில் வார்த்தை பட்டியல் மட்டுமே உள்ளது(ta_IN.aff file will empty in current hunspell distributions)
 
தற்பொது நாம் முயற்சிப்பது அதில் மேலும் வசதிகளை கூட்டுவது பற்றி. உதாரணம் அவன் என்ற வார்த்தை வைத்துக்கொண்டு, hunspellஐ -  அவனை , அவனுக்கு  போன்ற வார்த்தைகளை அடையாளம் காண வைக்க முடியும் . அதற்கான விதிகளை ta_IN.aff  என்ற hunspell  கோப்பில் கொடுக்கவேண்டும்(ta_IN.dic லும் மாற்றங்கள் செய்ய வேண்டும்)

இந்த hunspellஐ  மெருகூட்டும் முயற்சி யைப்பற்றித் தான் தற்போது விவாதித்திகொண்டிருக்கிறோம்.

இப்போது புரிகிறது!
 

நீங்களும் இதில் கலந்து கொள்ளவேண்டும்.

வேலை தலைக்கு மேலே இருக்கிறதே!

திவா

Muguntharaj Subramanian

unread,
Sep 14, 2011, 12:16:58 PM9/14/11
to freetamil...@googlegroups.com
Vanakkam Elanjelian,
I managed to get this working in firefox.

And also have bundled our affx and dic files (along with the latest aspell dictionary file)  into a firefox extension here:
https://addons.mozilla.org/en-US/firefox/addon/thamizha-solthiruthitamil-s/

Steps to use the extension:
1. install the extension
2. then open a exit window in firefox (eg. gmail compose mail) and right click and choose language as Tamil/India and start typing in tamil. Spellchecker & suggestions for tamil works nicely.

We can keep updating this firefox extension as we improve our affx file rules.

Regards,
Mugunth

2011/9/14 திவாஜி <agni...@gmail.com>

--
You received this message because you are subscribed to the Google Groups "ThamiZha! - Free Tamil Computing(FTC)" group.
To post to this group, send an email to freetamil...@googlegroups.com.
To unsubscribe from this group, send email to freetamilcomput...@googlegroups.com.
For more options, visit this group at http://groups.google.com/group/freetamilcomputing?hl=en-GB.

M.Mauran

unread,
Sep 14, 2011, 12:22:17 PM9/14/11
to freetamil...@googlegroups.com
இளஞ்செழியன், முகுந்த்,

(இன்னமும் நான் இந்தச்சொல்திருத்தியின் உள்ளியக்கங்களை ஆராயவில்லை)

இச்சொல் திருத்தியில், தவறான எழுத்துக்கூட்டல்கள் என்று நாம் உருவாக்கும் பட்டியலைப் பயன்படுத்தியும் எழுத்துக்கூட்டலைச் சரிபார்க்கும் வசதியைச் சேர்க்க முடியுமா?

எடுத்துக்காட்டாக, "சித்தரிப்பு" என்ற சொல் தவறு என்று நாம் ஒரு பட்டியலை உள்ளிட்டு வைத்துக்கொண்டால், எவராவது "சித்தரிப்பு" என்று எழுதினால் கோடிட்டுக் காட்ட வேண்டும். அத்தோடு, சரியான சொல்லாக "சித்திரிப்பு" என்பதைப் பரிந்துரைக்க வேண்டும்.


-மு. மயூரன்




--
மு. மயூரன் | මු. මයූරන් | M. Mauran




2011/9/14 Muguntharaj Subramanian <mug...@gmail.com>

M.Mauran

unread,
Sep 14, 2011, 12:39:15 PM9/14/11
to freetamil...@googlegroups.com
நான் முன்னைய மடலில் கேட்ட வசதியை WARN, FORBIDWARN flags மூலம் பெற்றுக்கொள்ள இயலுமா?



--
மு. மயூரன் | මු. මයූරන් | M. Mauran




2011/9/14 M.Mauran <mma...@gmail.com>

Elanjelian Venugopal

unread,
Sep 14, 2011, 1:37:38 PM9/14/11
to freetamil...@googlegroups.com
வணக்கம்.

வேண்டாத சொற்களை -- எ-டு கொச்சை சொற்களை -- எப்போதும் தவறாகவே காட்டுவதற்கு குறிப்பிட்ட அச்சொல்லின் முன் (.dic கோப்பில்) * குறியைச் சேர்த்துக் கொண்டால் போதும் என்று நினைக்கிறேன்.

"சித்தரிப்பு" என்பதற்கு "சித்திரிப்பு" என்று பரிந்துரைக்க வேண்டுமானால், .dic கோப்பில் சித்திரிப்பு என்ற சொல்லை மட்டுமே சேர்க்க வேண்டும். மற்றொரு சொல்லைச் சேர்க்காது விட்டு விடலாம். தேவைப்பட்டால் REP என்ற கட்டளையையும் .affix கோப்பில் பயன்படுத்தலாம். எ-டு REP ன்டு ண்டு -- "வேன்டும்" என்று யாராவது தவறாக எழுதிவிட்டால், "வேண்டும்" என்ற சரியான சொல்லைத் திருத்தி பரிந்துரைக்கும்.

குறிப்பு: "சித்தரிப்பு" என்ற சொல் க்ரியாவின் தற்காலத் தமிழ் அகராதியில் இடம் பெற்றிருக்கின்றது. அதனை தவறென்று நாம் கூறுவது சரியாகாது என்று நினைக்கிறேன்.

-இ.

2011/9/15 M.Mauran <mma...@gmail.com>

Elanjelian Venugopal

unread,
Sep 14, 2011, 5:01:50 PM9/14/11
to freetamil...@googlegroups.com
:)

இம்முயற்சிக்குப் புதிய சொற்பட்டியலைத் தயாரிக்க வேண்டும் போலிருக்கிறது. ஹன்ஸ்பெல்லால் நான்கு பகுதிகளை ஒன்றாக இணைக்கும் வசதி கொண்டிருப்பதால் இவ்வாறு செய்யத் தேவைப்படும் என்று நினைக்கிறேன்.

எ-டு: மரம் என்ற அடிச்சொல்லை எடுத்துக் கொள்வோம். ஹன்ஸ்பெல்லால் அ + மரம் + கள் + இன் என்ற நான்கு பகுதிகளையும் விதிகளைக் கொண்டே புரிந்து கொள்கிறது. நான்குக்கு மேற்பட்ட பகுதிகளையும் சேர்க்க முடியுமா என்று சோதித்துப் பார்க்க வேண்டும்.

ஆதலால், அகராதியிலுள்ள அனைத்து சொற்களையும் பட்டியலிடுவதற்கு பதில், அடிச்சொல்லை மட்டும் கொடுத்தால் போதுமானதாக இருக்கலாம்.

அதே வேளையில், 50 இலட்சம் சொற்தொகுதியின் முடிவுகளும் இப்போது நம் கையில் இருக்கிறது. அதனைக் கொண்டு, தேவையான சொற்களை மட்டும் பட்டியலில் சேர்க்கலாம். கற்காலச் சொற்களை நீக்கி விடலாம். அகராதியும் வேகமாகச் செயல்படும். வெட்டிப்பரிந்துரைகளையும் தவிர்க்கலாம்.

இன்னும் சந்தியைத்தான் எவ்வாறு கையாள்வது என்று தெரியவில்லை. சந்தி இலக்கணம் சார்த ஒன்றாதலால், அதற்கு வேறு மென்பொருளைப் பயன்படுத்த நேரிடலாம்.

-இ.


2011/9/15 Muguntharaj Subramanian <mug...@gmail.com>

த*உழவன்

unread,
Sep 15, 2011, 9:23:32 AM9/15/11
to ThamiZha! - Free Tamil Computing(FTC)
//50 இலட்சம் சொற்தொகுதி// என்று குறிப்பிட்டிருந்தீர்கள் அதனை
விக்சனரியினர் காண இயலுமா? அது பற்றி அறிய ஆவல்.

On Sep 15, 2:01 am, Elanjelian Venugopal <tamil...@gmail.com> wrote:
> :)
>
> இம்முயற்சிக்குப் புதிய சொற்பட்டியலைத் தயாரிக்க வேண்டும் போலிருக்கிறது.
> ஹன்ஸ்பெல்லால் நான்கு பகுதிகளை ஒன்றாக இணைக்கும் வசதி கொண்டிருப்பதால் இவ்வாறு
> செய்யத் தேவைப்படும் என்று நினைக்கிறேன்.
>
> எ-டு: மரம் என்ற அடிச்சொல்லை எடுத்துக் கொள்வோம். ஹன்ஸ்பெல்லால் அ + மரம் + கள்
> + இன் என்ற நான்கு பகுதிகளையும் விதிகளைக் கொண்டே புரிந்து கொள்கிறது.
> நான்குக்கு மேற்பட்ட பகுதிகளையும் சேர்க்க முடியுமா என்று சோதித்துப் பார்க்க
> வேண்டும்.
>
> ஆதலால், அகராதியிலுள்ள அனைத்து சொற்களையும் பட்டியலிடுவதற்கு பதில்,
> அடிச்சொல்லை மட்டும் கொடுத்தால் போதுமானதாக இருக்கலாம்.
>
> அதே வேளையில், 50 இலட்சம் சொற்தொகுதியின் முடிவுகளும் இப்போது நம் கையில்
> இருக்கிறது. அதனைக் கொண்டு, தேவையான சொற்களை மட்டும் பட்டியலில் சேர்க்கலாம்.
> கற்காலச் சொற்களை நீக்கி விடலாம். அகராதியும் வேகமாகச் செயல்படும்.
> வெட்டிப்பரிந்துரைகளையும் தவிர்க்கலாம்.
>
> இன்னும் சந்தியைத்தான் எவ்வாறு கையாள்வது என்று தெரியவில்லை. சந்தி இலக்கணம்
> சார்த ஒன்றாதலால், அதற்கு வேறு மென்பொருளைப் பயன்படுத்த நேரிடலாம்.
>
> -இ.
>

> 2011/9/15 Muguntharaj Subramanian <mugu...@gmail.com>> Vanakkam Elanjelian,


> > I managed to get this working in firefox.
>
> > And also have bundled our affx and dic files (along with the latest aspell
> > dictionary file)  into a firefox extension here:

> >https://addons.mozilla.org/en-US/firefox/addon/thamizha-solthiruthita...


>
> > Steps to use the extension:
> > 1. install the extension
> > 2. then open a exit window in firefox (eg. gmail compose mail) and right
> > click and choose language as Tamil/India and start typing in tamil.
> > Spellchecker & suggestions for tamil works nicely.
>
> > We can keep updating this firefox extension as we improve our affx file
> > rules.
>
> > Regards,
> > Mugunth
>

> > 2011/9/14 திவாஜி <agnih...@gmail.com>
>
> >> 2011/9/14 Muguntharaj Subramanian <mugu...@gmail.com>

> > Follow me @http://twitter.com/mugunth

Yagna

unread,
Sep 15, 2011, 9:58:16 PM9/15/11
to freetamil...@googlegroups.com
சந்தி is pretty much the compounding concept in hunspell. Hunspell has a strong linguistic model that can take care of many morphological characteristic of languages.

Yagna

2011/9/15 த*உழவன் <tha.u...@gmail.com>



--
Imagine | Innovate | Inspire

Muguntharaj Subramanian

unread,
Sep 15, 2011, 10:38:20 PM9/15/11
to freetamil...@googlegroups.com


2011/9/16 Yagna <yag...@gmail.com>

சந்தி is pretty much the compounding concept in hunspell. Hunspell has a strong linguistic model that can take care of many morphological characteristic of languages.

Yagna


Hi Yagna,
This is a good news. If we can explore this compounding concept and introduce Sandhi correction that will be a great move.

Please explore that and get a proof of concept working and we can get help from others to create a complete sandhi correction feature.

Regards,
Mugunth

 

Muguntharaj Subramanian

unread,
Sep 15, 2011, 10:41:25 PM9/15/11
to freetamil...@googlegroups.com


2011/9/15 த*உழவன் <tha.u...@gmail.com>

//50 இலட்சம் சொற்தொகுதி// என்று குறிப்பிட்டிருந்தீர்கள் அதனை
விக்சனரியினர் காண இயலுமா? அது பற்றி அறிய ஆவல்.


அன்புள்ள த*உழவன்,
50 இலட்சம் சொற்த்தொகுதி என்பது இனையத்திலிருந்து  சேகரிக்கப்பட்ட வார்த்தைகள் மட்டுமே. அவை என்னிடம் தற்போது இருக்கிறது. 
அதை இங்கிருந்து தரவிரக்கிக் கொள்ளலாம். http://borel.slu.edu/obair/ta.zip

அவை  விக்சனரிக்கு பயன்படாது என்று நினைக்கிறேன்.  இருந்தாலும் நீங்கள் அதை தரவிறக்கிப்பாருங்கள்.


அன்புடன்,
முகுந்த்

Yagna

unread,
Sep 15, 2011, 11:58:34 PM9/15/11
to freetamil...@googlegroups.com
1. I have checked the current files with Mac OS X and it works flawless.
2. I'm onto the next thing - suffixes that I'm planning to create from madras U Tamil lexicon. 
3. With regard to creating the best possible suggestion for correction, statistical relational learning algorithms are used by looking at the word frequency patterns. Kevin scannell has created a crawler that creates this from web and this is what mugunth has pointed to. 

I think we can get a pretty good spellchecker for Tamil finally. 

Yagna

Sent from my iPhone
--

Arunan Skanthan

unread,
Sep 16, 2011, 1:16:29 AM9/16/11
to freetamil...@googlegroups.com
I can confirm works on OS X firefox pretty well :)

2011/9/16 Yagna <yag...@gmail.com>



--
@askalot
Website: http://arunanskanthan.com
---
"Ariels in the sky. When you free small mind, you free your life..."

Elanjelian Venugopal

unread,
Sep 16, 2011, 6:33:45 AM9/16/11
to freetamil...@googlegroups.com
இச்சொல்திருத்தியின் நீட்சி இப்போது இங்கு கிடைக்கும்: http://extensions.services.openoffice.org/en/project/ta-IN-spellchecker

-இ.

2011/9/16 Arunan Skanthan <arunan....@gmail.com>

Elanjelian Venugopal

unread,
Sep 16, 2011, 7:22:13 AM9/16/11
to freetamil...@googlegroups.com
முன்பு அனுப்பிய இணைப்பைத் தொடர்பு கொள்ள முடியவில்லை. ஆதலால், நீட்சியை இம்மடலுடன் இணைத்து அனுப்புகிறேன். -இ.

2011/9/16 Elanjelian Venugopal <tami...@gmail.com>
dict-ta.oxt

Muguntharaj Subramanian

unread,
Sep 17, 2011, 12:45:33 PM9/17/11
to freetamil...@googlegroups.com
வணக்கம் இளஞ்செழியன்,
ஒப்பன் ஆபீஸ்க்கு மற்றும் லிபர் ஆபீஸ் செயலிகளுக்கு சொல் திருத்தி நீட்சி செய்தமைக்கு பாராட்டுகள் .

இந்த புதிய கோப்புகளை பயர்பாக்ஸ் நீட்சியிலும் சேர்த்து விடுகிறேன்.

சொல்திருத்தி திட்டத்தில் வேகமாக முன்னேற்றம் அடைந்து வருவது மகிழ்ச்சி. இந்த முன்னேற்றங்களை நாம் பொதுமக்கள் உடனுக்குடன் அனுபவிக்கும் விதமாக பொது பயன்பாடு செயலிகளை உருவாக்கவேண்டும். நாம் ஏற்கனவே பயர்பாக்ஸ் மற்றும் லிபர்ஆபீஸ் நீட்களாக இவற்றை வெளியிட்டுள்ளோம். அதேபோல் மற்ற செயலிகளிலும் இந்த சொல்திருத்தியை சேர்க்கவேண்டும்.

நான் அடுத்ததாக எ-கலப்பைக்குள் இதனை எப்படி சேர்ப்பது என்று ஆராயவிருக்கிறேன். அதேபோல் இதனை குரோம், மற்றும் இன்டர்நெட் எக்ஸ்புளோரரிலும் சேர்க்க தேவையான நீட்சிகளை செய்ய முயற்சிக்க வேண்டும்.

நாம் அடுத்து உடனே செய்ய வேண்டியப் பணிகளாக நான் கருதுவது:

1. நம் கிட்ஹப் தளத்தில் சொல்திருத்திக்கு ஒரு புரோஜக்டை தொடங்கவேண்டும்.  அதில் கீழேயுள்ள கோப்புகளின் தற்போதைய பதிப்புகளை பராமரிக்கலாம்.
    அ. ஹன்ஸ்பெல் மற்றும் ஆஸ்பெல் வடிவத்திலுள்ள .dic மற்றும் .affx கோப்புகள்.
    ஆ. பயர்பாக்ஸ் சொல்திருத்தி நீட்சியின் கோப்புகள் (இதனை சொல்திருத்தின் கீழ் ஒரு உபத் திட்டமாக உருவாக்கலாம்)
    இ. லிபர் ஆபீஸ் சொல்திருத்தி நீட்சியின் கோப்புகள் (மேலேயுள்ளது போல் சொல்திருத்தியின் ஒரு உபத்திட்டமாக)

2. சாதாரண பயனருக்கு புரியும்படி  இந்த சொல்திருத்தியை எவ்வாறு பயன்படுத்தலாம் என்று விளக்க கட்டுரைகளை எழுதவேண்டும்.

3. சொல்திருத்தியுடன் சந்தி திருத்தலையும் செய்ய வைக்கவேண்டும் - தமிழ் மொழியியல் துறை அறிஞர்களின் உதவியை பெறவேண்டும் - நண்பர் இளசுந்தரம் இதற்கு உதவி தேவைப்படுகிறது.

4. தொடர்ந்து நாம் பயன்படுத்தி பிழைகளை நீக்கி புதிய .dic மற்றும் .affx கோப்புகளை வெளியிட்டு வரவேண்டும்.


அன்புடன்,
முகுந்த்


2011/9/16 Elanjelian Venugopal <tami...@gmail.com>

Mayu Mayooresan

unread,
Sep 17, 2011, 10:59:06 PM9/17/11
to freetamil...@googlegroups.com
அன்பின் முகுந், இளஞ்செழியன், 

வின்டோஸ் 7 மற்றும் 8 இல் ஓபன் ஆபீசில் சரிவர வேலை செய்கின்றது. எவ்வாறு லிபர் ஆபிசில் இந்த நீட்சியைச் சேர்ப்பது என்று புரியவில்லை. 

ஏதாவது இணைப்புகள் தர முடியுமா?

நன்றி
மயூரேசன்

2011/9/17 Muguntharaj Subramanian <mug...@gmail.com>

Elanjelian Venugopal

unread,
Sep 18, 2011, 12:57:30 AM9/18/11
to freetamil...@googlegroups.com
வணக்கம்.

முதலில், லிப்ரெஓபிஸ் ( http://www.openoffice.org/ ) அல்லது ஓபனோபிஸை ( www.libreoffice.org/ ) பதிவிறக்கிக் கொள்ளுங்கள்; நிறுவுங்கள்.

அடுத்து, சொல்திருத்தி நீட்சியை http://extensions.services.openoffice.org/en/project/ta-IN-spellchecker இணைப்பிலிருந்து பதிவிறக்கிக் கொள்ளுங்கள்:

இறுதியாக, லிப்ரெஓபிஸ் அல்லது ஓபனோபிஸைத் தொடக்கி, கருவிகள் > நீட்சி மேலாளர் > சேர் ஐச் சொடுக்கி, பதிவிறக்கிவிறக்கி வைத்திருக்கும் நீட்சியைச் சேருங்கள். அவ்வளவுதான்.

குறிப்பு: ஆங்கில இடைமுகப்பைப் பயன்படுத்தினால், Tools > Extension Manager > Add என்ற கட்டளைகளைப் பயன்படுத்தவும்.

-இ.


2011/9/18 Mayu Mayooresan <may...@gmail.com>

Mayu Mayooresan

unread,
Sep 18, 2011, 1:05:39 AM9/18/11
to freetamil...@googlegroups.com
மிக்க நன்றி இளஞ்செழியன்.
Regards,
J.Mayooresan
| http://mayuonline.com |


2011/9/18 Elanjelian Venugopal <tami...@gmail.com>

Mayu Mayooresan

unread,
Sep 18, 2011, 6:14:05 AM9/18/11
to freetamil...@googlegroups.com
அருமையாகச் செயற்படுகின்றது. லிபரல் ஆபிஸ் 3.4.3 வின்டோஸ் 7 இல் தமிழில் தட்டச்சிடும் போது உடைந்து விடுகின்றது. இது பற்றி ஒரு வழு அறிக்கையையும் சமர்பித்தேன்.
https://bugs.freedesktop.org/show_bug.cgi?id=40980

வின்டோஸ் 8 இல் லிபரல் ஆபீசில் இந்த சொருகியைப் பயன்படுத்தி சோதித்துப் பார்த்ததில் யாவரும் இத்தனை காலமும் எதிர்பார்த்துக் காத்திருந்த சொற் பிழை திருத்தி கிடைத்ததில் மகிழ்ச்சி. 

இந்த ஹன் ஸ்பெல் மூலம் குரோமிற்கு சொற் பிழை திருத்தி யாராவது அமைக்க முடியுமா?

Regards,
J.Mayooresan
| http://mayuonline.com |


2011/9/18 Mayu Mayooresan <may...@gmail.com>

கா. சேது | කා. සේතු | K. Sethu

unread,
Sep 18, 2011, 10:22:59 AM9/18/11
to freetamil...@googlegroups.com
நண்பர்களே

இதுவரை Libre க்கு இவ்விழையில் கண்ட எழுத்துப் பெயர்ப்புக்கள் -> லிப்ரே,
லிபர், லிபரல்.

சற்று அலசுவோம்

http://translate.google.com/ பக்கத்துக்குப் போங்கள்

மூல மொழி (இடது பெட்டகத்தில்) ஆங்கிலம் தெரிவு செய்யுங்கள். Libre என
தட்டச்சிடுங்கள். அப் பெட்டகத்தில் உள்ள ஒலிபெருக்கி ஓவத்தை (icons ஐ)
சொடுக்கிக் கேளுங்கள். எனக்கு கேட்பது "லீப்ரா" எனவே. பகரம் ஒலிப்புடை
-B வகையாக. அதாவது lee-bra போல. வேறு அகரமுதலிகளிலும் அவ்வாறே அமெரிக்க
மற்றும் இங்கிலாந்து ஆங்கில பலுக்கல்கள் எனத் தெரிந்தது.

இவ்வார்த்தை பிரெஞ்சு மற்றும் எசுபானியம் மொழிகளில் இருந்து வந்ததாக பல
அகரமுதலிகள் குறிப்பிடுகின்றன.

எனவே மேற்குறிப்பிட்ட கூகிள் மொழிபெயர்ப்பி பக்கத்தில் இடது பக்கம்
ஆங்கிலத்தில் Libre இட்டு வலது பெட்டகத்தில் பிரெஞ்சு தெரிவு செய்து
மொழிபெயர்ப்பு பொத்தானை அழுத்தினால் பிரெஞ்சுவிலும் அதே எழுத்துக்
கூட்டலுடன் வருகிறது. அதன் ஒலிப்பு "லீபா" (lee-bah) போல. மாறாக Spanish
க்கு மொழிபெயர்ப்பின் அதே எழுத்துக் கூட்டலுடன் வருகிறது. அதன் ஒலிப்பு
லீவரே (lee-va-ray) போலக் கேட்கிறது.

மேலும் இத்தாலிய மொழிக்குப் பார்த்தால் அதே எழுத்துக்கூட்டல் உடன்
ஒலிப்பு லீபரே (lee-ba-ray) போலக் கேட்கிறது.

தமிழிற்கு (ஆங்கிலத்திலிருந்து) மொழிப்பெயர்த்தால் 'லிப்ரே' என
எழுதுக்கூட்டல் வருகிறது. ஆனால் ஒலிப்பு லீப்ரே (Lee-bray) என வருகிறது.

அவ் எல்லாவற்றிலும் நெடில் லீ ஒலிப்புடன்தான் முதல் எழுத்தின் பலுக்கல்
காணப்படுகிறது.

எனவே தமிழல் லீப்ரா (ஆங்கிலம் போல ), லீபா (பிரெஞ்சு போல) , லீவரே
(எசுபானியத்தில் போல), லீபரே (இத்தாலியம் போல), லீப்ரே (கூகுள்
தமிழாக்கத்தில் போல) ஆகியனவற்றில் ஒன்றாகலாமா?

பகரத்தின் மெய்யொற்று ஒலிப்புடையாகுவது தமிழுக்கு ஒவ்வாதலால் அவற்றிற்கு
இகரமாக்கலாம் - லீப்ரா -> லீபிரா மற்றும் லீப்ரே -> லீபிரே

லகரம் மொழிமுதலாகாது எனவுள்ள இலக்கண மரபை மதிப்பதாயின் அச் சொற்கள்
முதலில் இகரம் இட வேண்டும் - இலீபிரா, இலீவரே, இலீபரே மற்றும் இலீபிரே.
அவ்வளவு இறுக்கமாக நாம் இயங்குவதாயின் லினக்ஸ் என எழுதுவதை இலினக்சு
என்றல்லவா எழுத வேண்டும். :P

எனவே லீபிரா, லீவரே, லீபரே, லீபிரே இவற்றில் ஒன்றா? வேறு ஏதாவதா?.

யாரோ இலங்கை வடபுல வழக்கில் எழுத்துப்பெயர்கேக்க t தான் ர எனவும் r
அநேகமாக ற எனவும் முணுமுணுக்கத் தொடங்குவது கேட்குது - அதனால நான் escape
;>)

~சேது

2011/9/18 Mayu Mayooresan <may...@gmail.com>:

Lavanya Sundararajan

unread,
Sep 19, 2011, 12:45:01 AM9/19/11
to freetamil...@googlegroups.com
இந்த project-ல் எப்படி பங்களிப்பது?

2011/9/18 கா. சேது | කා. සේතු | K. Sethu <skh...@gmail.com>

Malavan B

unread,
Sep 19, 2011, 1:34:47 AM9/19/11
to freetamil...@googlegroups.com
Solthiruthi.png

நான் உபுண்டு 10.04 LTS பதிவில் உள்ள firefox 3.6.22 பயன்படுத்துகின்றேன். அதில் தமிழா சொல்திருத்தி addon ஐ தரவிறக்க முயலும் போது மேலே காட்டியது போல் வழு ஏற்படுகிறது. யாராவது உதவ முடியுமுமா?

-Thanks & Regards,
Malavan.B



2011/9/19 Lavanya Sundararajan <lavanya.su...@gmail.com>
Solthiruthi.png

Muguntharaj Subramanian

unread,
Sep 19, 2011, 1:41:33 AM9/19/11
to freetamil...@googlegroups.com
வணக்கம் மாலவன்,

இந்த சுட்டியிலிருந்து முயற்சித்துப்பாருங்கள்:

https://github.com/downloads/thamizha/solthiruthi/thamizha_solthiruthi.xpi

-முகுந்தராஜ்


நான் உபுண்டு 10.04 LTS பதிவில் உள்ள firefox 3.6.22 பயன்படுத்துகின்றேன். அதில் தமிழா சொல்திருத்தி addon ஐ தரவிறக்க முயலும் போது மேலே காட்டியது போல் வழு ஏற்படுகிறது. யாராவது உதவ முடியுமுமா?

-Thanks & Regards,
Malavan.B

Malavan B

unread,
Sep 19, 2011, 1:45:46 AM9/19/11
to freetamil...@googlegroups.com
நன்றி முகுந்தராஜ், நீங்கள் அனுப்பிய சுட்டி வேலைசெய்கிறது.

-Thanks & Regards,
Malavan.B



2011/9/19 Muguntharaj Subramanian <mug...@gmail.com>
--

Muguntharaj Subramanian

unread,
Sep 19, 2011, 9:58:43 AM9/19/11
to freetamil...@googlegroups.com


2011/9/19 Lavanya Sundararajan <lavanya.su...@gmail.com>

இந்த project-ல் எப்படி பங்களிப்பது?


வணக்கம் லாவன்யா மற்றும் நண்பர்களே,

நீங்கள் இந்த திட்டத்தில் கீழேயுள்ள வழிகளில் பங்களிக்கலாம்:

1. ta.affx  கோப்பு தயாரிப்பு மற்றும் ta.dic நெறிப்படுத்தல்
இது தான் தற்போதுள்ள கடினமான மற்றும் முக்கியமான பணி. இதை இளஞ்செழியன் தன்னந்தனியாக செய்து கொண்டிருக்கிறார். இந்தக் கோப்புகளின் கிட்ஹப் சுட்டி இங்கே: https://github.com/thamizha/solthiruthi/blob/master/ta_TA.aff
https://github.com/thamizha/solthiruthi/blob/master/ta_TA.dic
https://github.com/thamizha/solthiruthi/blob/master/ta_TA_2.dic
https://github.com/thamizha/solthiruthi/blob/master/ta_TA_3.dic
https://github.com/thamizha/solthiruthi/blob/master/ta_TA_4.dic

இவை சொல்திருத்திக்கான விதிகளை உருவாக்குவது.

இந்தப் பணியில் எவ்வாறு பங்களிக்கலாம் என்பதற்கு இளஞ்செழியன் ஒரு விக்கி ஆவணத்தை உருவாக்கினால் பயனுள்ளதாக இருக்கும். கிட்ஹப் தளத்திலேயே இங்கு அதை உருவாக்கலாம் - https://github.com/thamizha/solthiruthi/wiki

2. இந்த சொல்திருத்தியை குரோம் உலாவி , இன்டர்நெட் எக்ஸ்பிரஸ் மற்றும் இதுபோன்ற செயலிகளில் பயன்படத்தக்கவகையில் நீட்சிகளை உருவாக்க முயற்சிக்கலாம்.

3. இந்த திட்டத்தைப் பற்றி உங்கள் வலைத்தளங்களில், புளாக், பேஸ்புக் தளங்களில் எழுதி மற்றவர்களுக்குத் தெரியப்படுத்தலாம்.


அன்புடன்,
முகுந்த்

Elanjelian Venugopal

unread,
Sep 20, 2011, 1:32:26 AM9/20/11
to freetamil...@googlegroups.com
முகுந்த்,

தமிழா வலைத்தளத்திலிருந்து தேவையான -- லீப்ரஓபிஸ் அல்லது பயர்பொக்ஸ் -- சொல்திருத்தியைப் பதிவிறக்கிக் கொள்வதற்கு அங்கு ஒரு வசதியை ஏற்படுத்தி வையுங்கள். பயனர்கள் தமிழா சொல்திருத்திக்காக ஆங்காங்கு தேடிச் சேல்ல வேண்டியிருக்காது. ஒரு இடத்திலேயே அனைத்து இணைப்புகளும் இருக்கும்.

நன்றி. -இ.

2011/9/18 Muguntharaj Subramanian <mug...@gmail.com>

Ila. Sundaram

unread,
Sep 21, 2011, 10:16:24 AM9/21/11
to ThamiZha! - Free Tamil Computing(FTC)
கணித்தமிழ் நண்பர்களுக்கு வணக்கம்.

சொல் திருத்தித் திட்டத்தில் பங்காற்றுவதுதற்குத் தயாராக உள்ளேன்.
இந்த மின்னஞ்சலைப் பார்காது தவறவிட்டேன் மன்னிக்கவும்.
பழையதைக் கிளறும்போது கிடைத்தது.
எந்த மாதிரியான பங்களிப்பைச் செய்யவேண்டும் என்பதை அறிய விரும்புகிறேன்.
மொழியியல் அடிப்படையில் எழுத்துப் பிழைகளையும் சந்தி பிழைகளையும்
சரிசெய்யப் பல அடிப்படைச் செயல்களைச் செய்யவேண்டியிருக்கிறது. இது
தொடர்பாக விவாதிப்போம் உருவாக்குவோம்.
இதில் பங்களிக்க ஆவலாக இருக்கிறேன்.
நன்றி....
என்றும் அன்புடன்
இல. சுந்தரம்

> 2011/9/16 Elanjelian Venugopal <tamil...@gmail.com>

Arunan Skanthan

unread,
Sep 21, 2011, 8:58:04 PM9/21/11
to freetamil...@googlegroups.com
@Mugunth... can you suggest how he can help?

2011/9/22 Ila. Sundaram <ilasu...@gmail.com>
--
You received this message because you are subscribed to the Google Groups "ThamiZha! - Free Tamil Computing(FTC)" group.
To post to this group, send an email to freetamil...@googlegroups.com.
To unsubscribe from this group, send email to freetamilcomput...@googlegroups.com.
For more options, visit this group at http://groups.google.com/group/freetamilcomputing?hl=en-GB.

Reply all
Reply to author
Forward
0 new messages