क्या ये हिंदी क्रिया रूप सही हैं?

99 views
Skip to first unread message

shree

unread,
Dec 1, 2014, 1:49:32 AM12/1/14
to technic...@googlegroups.com
Please see attached file with generated hindi verb forms.

Please let me  know whether the usage of chandrabindu/anuswar is correct in the generation of verb forms?

Also let me know if you notice any other errors.

hi-verbs.dic is the list of क्रिया-पद 
hi-verbs.txt is the generated क्रिया-रूप 
based on the affix rules in hi-verbs.aff.
hi-verbs.dic
hi-verbs.txt
hi-verbs.aff

ShreeDevi Kumar

unread,
Dec 1, 2014, 1:53:40 AM12/1/14
to technic...@googlegroups.com
Please ignore the wordforms for करके and कराके . 

ShreeDevi
____________________________________________________________
भजन - कीर्तन - आरती @ http://bhajans.ramparivar.com

--
आपको यह संदश इसलिए मिला है क्योंकि आपने Google समूह के "Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)" समूह की सदस्यता ली है.
इस समूह की सदस्यता समाप्त करने और इससे ईमेल प्राप्त करना बंद करने के लिए, technical-hin...@googlegroups.com को ईमेल भेजें.
अधिक विकल्पों के लिए, https://groups.google.com/d/optout में जाएं.

V S Rawat

unread,
Dec 1, 2014, 2:00:26 AM12/1/14
to technic...@googlegroups.com
क्या सभी या अधिकतर सदस्यों के लिए ये फ़ाइलें उपयोगी रहेंगी या वो लोग इस पर कुछ काम करेंगे?

मेरे कहने का मतलब है कि हम कई सारी बड़ी फ़ाइलों को पूरे समूह को न भेजा करें, बल्कि यदि
कोई व्यक्ति उस थ्रेड में रुचि ले रहा है तो उसको डायरेक्ट मेल से भेज दिया करें।

इस विषय की थ्रेड में मैं अक्सर कुछ सदस्यों को कुछ फ़ाइलें भेजता पा रहा हूँ।

हाँ, यदि किसी फ़ाइल में किसी कार्य का अंतिम आउटपुट है या जो अधिकांश लोगों के काम आ
सकती है, उसे अवश्य भेजा करें।

धन्यवाद।
रावत

ShreeDevi Kumar

unread,
Dec 1, 2014, 2:27:24 AM12/1/14
to technic...@googlegroups.com
​Rawatji,

Your point regarding attachments is well taken. I shall post ​links to files in the future.

I thought that there would be interest in the group members in general regarding development of a spellchecker which supported word-forms for Hindi without needing to list each word separately. Hence I had been posting to the group ... 

ShreeDevi
____________________________________________________________
भजन - कीर्तन - आरती @ http://bhajans.ramparivar.com

--
आपको यह संदेश इसलिए प्राप्त हुआ क्योंकि आपने Google समूह "Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)" समूह की सदस्यता ली है.
इस समूह की सदस्यता समाप्त करने और इससे ईमेल प्राप्त करना बंद करने के लिए, technical-hindi+unsubscribe@googlegroups.com को ईमेल भेजें.
अधिक विकल्‍पों के लिए, https://groups.google.com/d/optout पर जाएं.

V S Rawat

unread,
Dec 1, 2014, 6:54:53 AM12/1/14
to technic...@googlegroups.com
You are a sincere helping person and always follow the scope of the
group, and carried serious discussion and shared useful information and
thoughts,

so no issue.

Glad that you have decide a good option on this also.

Thanks.
--
Rawat

On 12/1/2014 12:56 PM, ShreeDevi Kumar wrote:
> ​Rawatji,
>
> Your point regarding attachments is well taken. I shall post ​links to
> files in the future.
>
> I thought that there would be interest in the group members in general
> regarding development of a spellchecker which supported word-forms for
> Hindi without needing to list each word separately. Hence I had been
> posting to the group ...
>
> ShreeDevi
> ____________________________________________________________
> भजन - कीर्तन - आरती @ http://bhajans.ramparivar.com
>
> 2014-12-01 12:30 GMT+05:30 V S Rawat <vsr...@gmail.com
> <mailto:vsr...@gmail.com>>:

ShreeDevi Kumar

unread,
Dec 3, 2014, 6:44:36 AM12/3/14
to technic...@googlegroups.com

"चंद्रबिंदु के बिना प्राय: अर्थ में भ्रम की गुंजाइश रहती है। जैसे :– हंस : हँस, अंगना : अँगना, स्वांग (स्व+अंग): स्वाँग आदि में। अतएव ऐसे भ्रम को दूर करने के लिए चंद्रबिंदु का प्रयोग अवश्य किया जाना चाहिए। किंतु जहाँ (विशेषकर शिरोरेखा के ऊपर जुड़ने वाली मात्रा के साथ) चंद्रबिंदु के प्रयोग से छपाई आदि में बहुत कठिनाई हो और चंद्रबिंदु के स्थान पर बिंदु का (अनुस्वार चिहन का) प्रयोग किसी प्रकार का भ्रम उत्पन्न न करे, वहाँ चंद्रबिंदु के स्थान पर बिंदु के प्रयोग की छूट रहेगी। जैसे :– नहीं, में, मैं आदि। कविता आदि के प्रसंग में छंद की दृष्टि से चंद्रबिंदु का यथास्थान अवश्‍य प्रयोग किया जाए। इसी प्रकार छोटे बच्चों की प्रवेशिकाओं में जहाँ चंद्रबिंदु का उच्चारण अभीष्ट हो, वहाँ मोटे अक्षरों में उसका यथास्थान सर्वत्र प्रयोग किया जाए। जैसे :– कहाँ, हँसना, आँगन, सँवारना, मेँ, मैँ, नहीँ आदि।"

Hence, I have allowed for both forms (with anuswar and chandrabindu) in the spell check dictionary. I have uploaded the word files and current version of dictionary to https://github.com/Shreeshrii/hindi-hunspell

eg; of various verb forms

अटक
अटकता
अटकती
अटकते
अटकना
अटकने
अटकर
अटकवा
अटकवाइए
अटकवाई
अटकवाऊँगा
अटकवाऊँगी
अटकवाऊंगा
अटकवाऊंगी
अटकवाएँगे
अटकवाएंगे
अटकवाएगा
अटकवाएगी
अटकवाता
अटकवाती
अटकवाते
अटकवाना
अटकवाने
अटका
अटकाइए
अटकाई
अटकाऊँगा
अटकाऊँगी
अटकाऊंगा
अटकाऊंगी
अटकाएँगे
अटकाएंगे
अटकाएगा
अटकाएगी
अटकाता
अटकाती
अटकाते
अटकाना
अटकाने
अटकिए
अटकिएगा
अटकूँगा
अटकूँगी
अटकूंगा
अटकूंगी
अटके
अटकेँगे
अटकेंगे
अटकेगा
अटकेगी
अटको






ShreeDevi
____________________________________________________________
भजन - कीर्तन - आरती @ http://bhajans.ramparivar.com

2014-12-01 12:19 GMT+05:30 shree <shree...@gmail.com>:

--
आपको यह संदश इसलिए मिला है क्योंकि आपने Google समूह के "Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)" समूह की सदस्यता ली है.
इस समूह की सदस्यता समाप्त करने और इससे ईमेल प्राप्त करना बंद करने के लिए, technical-hin...@googlegroups.com को ईमेल भेजें.
अधिक विकल्पों के लिए, https://groups.google.com/d/optout में जाएं.

Leena Mehendale

unread,
Dec 3, 2014, 6:56:09 AM12/3/14
to technic...@googlegroups.com
very correctly And painstakingly done. Badhai
--
ईशावास्यमिदं सर्वं यत्किंच जगत्यां जगत्।
तेन त्यक्तेन भुञ्जीथाः मा गृधः कस्यस्विद्धनम्।।
for learning  easy HINDI TYPING click here  बालसुलभ भारतीय टंकलिपी
Leena Mehendale
Goa State Chief Information Commissioner
Ground floor, Shram shakti Bhavan
Patto, Panaji
Goa 403001
Ph (Res) 0832-2425100
Mo. 09422055740


Hariraam

unread,
Dec 4, 2014, 8:00:16 AM12/4/14
to technic...@googlegroups.com
'both the forms' will be confusing(भ्रम पैदा करनेवाले), specially for the small students.

Standardised form should be only one, but for keeping compatibility option of alternative word may be given (in अपवाद)

--

Please see again the above quoted standard
...किंतु जहाँ (विशेषकर शिरोरेखा के ऊपर जुड़ने वाली मात्रा के साथ) चंद्रबिंदु के प्रयोग से छपाई आदि में बहुत कठिनाई हो और चंद्रबिंदु के स्थान पर बिंदु का (अनुस्वार चिहन का) प्रयोग किसी प्रकार का भ्रम उत्पन्न न करे, वहाँ चंद्रबिंदु के स्थान पर बिंदु के प्रयोग की छूट रहेगी। ...

As above sentence clarifies:
1. छपाई में जहाँ बहुत कठिनाई हो -
पहले हिन्दी मैनुअल टाइपराइटर के जमाने में तथा पुराने 8बिट TTF फोंट्स के जमाने में अक्षरों (glyphs) की सीमित संख्या के कारण यह समस्या थी। किन्तु अब 16 बिट ओपेन टाइप फोंट्स में (यथा- मंगल में) ऊपर की मात्राओँ के साथ भी चन्द्रबिन्दु लगाने में कोई समस्या नहीं है। अतः छपाई में कोई कठिनाई नहीं है। अतः उपरोक्त छूट को आगामी मानकों में हटा लेने का सुझाव दिया गया है।

2. यहाँ किसी प्रकार का भ्रम उत्पन्न न करे।
विशेषकर छोटे बच्चों को शब्दों का सही उच्चारण सिखाने के लिए चन्द्रबिन्दु का सही प्रयोग आवश्यक है। क्योंकि यह भ्रम पैदा करेगा।

3. अरविन्द जी के समान्तर कोश में ऊपर की मात्राओं के साथ भी चन्द्रबिन्दु का प्रयोग सही रीति किया गया है।

4. आज जब विज्ञान इतना आगे बढ़ गया है। मोबाईल फोन में हिन्दी में बोलकर पाठ प्रविष्टि करने की सुविधा निःशुल्क उपलब्ध हो रही है। यदि व्यक्ति सही उच्चारण करता है तो सही शब्द टाइप होते हैं। यदि उच्चारण गलत हो तो पाठ गलत टाइप हो जाता है। अतः आम जनता के लिए सही उच्चारण आवश्यक हो गया है।

अतः ऐसे भ्रम पैदा करने वाले दोनों रूप वाले शब्दों को नहीं रखना चाहिए। सही रूप को ही स्पेल चेकर के उपयोग हेतु रखना चाहिए।


हरिराम
प्रगत भारत <http://hariraama.blogspot.com>

ShreeDevi Kumar

unread,
Dec 5, 2014, 1:45:59 AM12/5/14
to technic...@googlegroups.com
Hariramji,

Initially, I had also used only chandrabindu version (see the lists that I had emailed with my first message).

However, after looking at the existing Hindi pages on web (newspapers, india govt., rajbhasha sites etc), I saw that most are using the anusvar version. If I limit the list to chandrabindu, then all those pages will show up with multiple spelling errors.

I also looked at arvindlexicon eg. था - while it has the chandrabindu forms, it also has the anusvar versions ..
थानेदारों
​थानेदारोँ

थानों
थानोँ

थापों
थापोँ

थामेंगे
थामेँगे

थामेंगी
थामेँगी

थालियों
थालियोँ

थालों
थालोँ

---------
I am using google hindi input tools for typing, and it is only the anusavar version which comes up for all the above, in order to put chandrabindu, I had to invoke the keyboard.

So, I can very easily change the affix rules to accept only chandrabindu version as correct using the hunspell spellchack dictionary, but it may then NOT get used at all :-(

----
I would like to hear the opinion of other members regarding this too.

Should हैं actually be written as हैँ?




ShreeDevi
____________________________________________________________
भजन - कीर्तन - आरती @ http://bhajans.ramparivar.com

V S Rawat

unread,
Dec 5, 2014, 5:21:08 AM12/5/14
to technic...@googlegroups.com
I have not seen chandrabindu used above maatraas ि ी े ै ो ौ or maybe even
others

The sole reason could be that there is no space to put entire
chandrabindu, so just anuswar is put.

Thinking about that, it does bring inconsistency as to
yatha-likhit-tatha-pathit property of devanagari, that it is written
anuswar but pronounced as chandra bindu,

So, I guess something needs to be done to correct this inconsistency.

However, correcting that is beyond our powers. Some higher wider agency
should do something about it.

Still, Adding chandrabindu to all these maatras "looks" odd as we have
been seeing anuswar there all our life.

Why are you adding chandrabindu there when anuswar is traditionally used
there?

Thanks.
--
Rawat
> <mailto:hari...@gmail.com>>:
> <mailto:shree...@gmail.com>>:
>
> as per http://hi.wikipedia.org/wiki/मानक_हिंदी_वर्तनी
> <http://hi.wikipedia.org/wiki/%E0%A4%AE%E0%A4%BE%E0%A4%A8%E0%A4%95_%E0%A4%B9%E0%A4%BF%E0%A4%82%E0%A4%A6%E0%A5%80_%E0%A4%B5%E0%A4%B0%E0%A5%8D%E0%A4%A4%E0%A4%A8%E0%A5%80>
> <mailto:shree...@gmail.com>>:

narayan prasad

unread,
Dec 5, 2014, 6:28:28 AM12/5/14
to Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)
<<However, correcting that is beyond our powers. Some higher wider agency should do something about it.
Still, Adding chandrabindu to all these maatras "looks" odd as we have been seeing anuswar there all our life.>>


"हिन्दी शब्दसागर" देखिए ।
--- नारायण प्रसाद

Hariraam

unread,
Dec 5, 2014, 7:28:14 AM12/5/14
to technic...@googlegroups.com
I agree with Rawat Ji and support his views mentioned below.

Now required technology and facilities are available, so wrong practices should be avoided and a correct path to be laid for the future generations. This is the globalisation era and if will not correct ourselves, Hindi, Devanagari/Indic will be treated as unscientific/illogical/confusing in the whole world.

As clearly stated in मानक, right form should be used,
but (छूट) relaxation may be allowed if big difficulties faced anywhere.

Spell-checker must point-out the wrong uses, But option are also made available to the user to "ignore/ignore all".

However, if anyone used wrong spelling of Hindi/Indic words, there is neither any punishment, nor any objections, all those are accepted in society as "alternative form".

If spell-checker itself do not point-out the errors, then what is the use of it?

In almost all dictionaries "alternative form" of words are included for reference/knowledge, But dictionaries are not treated as spell-checkers or any standardised word-lists.


हरिराम
प्रगत भारत <http://hariraama.blogspot.com>

2014-12-05 15:51 GMT+05:30 V S Rawat <vsr...@gmail.com>:
I have not seen chandrabindu used above maatraas ि ी े ै ो ौ or maybe even others

The sole reason could be that there is no space to put entire chandrabindu, so just anuswar is put.

Thinking about that, it does bring inconsistency as to yatha-likhit-tatha-pathit property of devanagari, that it is written anuswar but pronounced as chandra bindu,

So, I guess something needs to be done to correct this inconsistency.

.....
--
Rawat


ShreeDevi Kumar

unread,
Dec 5, 2014, 11:12:49 AM12/5/14
to technic...@googlegroups.com
Good points, Hariraamji. I shall make corrections to the verbs file and inform.

A related question, regarding panchamakshars and anusvaar... 
which form(s) should be supported for spell-checker?

ShreeDevi
____________________________________________________________
भजन - कीर्तन - आरती @ http://bhajans.ramparivar.com

V S Rawat

unread,
Dec 5, 2014, 3:49:21 PM12/5/14
to technic...@googlegroups.com
I prefer manually changing all the words to half panchamakshar version
instead of anuswar version.

It takes me a lot of time and efforts, but this is correct method, and
so I have to do it.

Anuswar is only some shortcut for half panchamakshars, must have been
designed by some very lazy and casual person. No point encouraging it.

And, new entrants to Hindi must be finding it very difficult to figure
out whether anuswar is used for half m or for half n (as all other
(non-m) panchamkashar end up getting pronounced as half n).

So, it will be a great help for such new entrants to Hindi that they
clearly see the half panchamakshar written over there so they know how
to pronounce it without any error.

real anuswar is even a shorter nasal sound than a half n is, so real
anuswar should only be used where such a sound is coming. If you can
make out whether it is half n or half m coming out from mouth, then it
is not the place for anuswar, one should use actual panchamakshar.

--
Rawat
> <mailto:vsr...@gmail.com>>:

Hariraam

unread,
Dec 6, 2014, 2:02:13 AM12/6/14
to technic...@googlegroups.com
पञ्चमाक्षरोँ का प्रयोग ही सही होता है,
अनुस्वार का प्रयोग मैनुअल टाइपराइटर तथा पुराने 8बिट फोण्ट्स की सीमाओँ के चलते मजबूरी मेँ किया जाता था। तत्कालीन मानकोँ मेँ इनको विकल्प रूप मेँ स्वीकार किया गया था।

आजकल अधिकांश लोग अनुस्वार का प्रयोग करते हैं, अतः फिलहाल विकल्प देना होगा कि यदि यदि यूजर चाहे तो default settings अपनी जरूरत के मुताबिक कर सके। पञ्माक्षर या अनुस्वार...

हरिराम
प्रगत भारत <http://hariraama.blogspot.com>

ShreeDevi Kumar

unread,
Dec 6, 2014, 8:14:33 AM12/6/14
to technic...@googlegroups.com
On further research ...


Consonant and Mātrā + Nasal combinations: With Candrabindu - Set 1
As per rule 2.6.2.3. of the Central Hindi Directorate, Candrabindu cannot be placed over
matras which are above the Shirorekha and in this case the Candrabindu is replaced by an
Anuswar.
This rule could create issues for OCR/OHWR if Chandrabindu is inputted over matras
above the shirorekha and is automatically mapped to Anuswar as per the rule above. It is
proposed that a Normalisation rule be introduced. In the case of OCR/OHWR which
analyse the character at the display level, the combination matra+Anuswar will be shown
as such.

Consonant and Mātrā +Nasal combinations With Candrabindu - Set 2
This set is in continuation of set 1 above which shows combinations of Consonant and
Mātrā + Candrabindu. As per rule 2.6.2.3. of the Central Hindi Directorate, Candrabindu
cannot be placed over matras which are above the Shirorekha and in this case the
Candrabindu is replaced by an Anuswar.


-------
is this going to be changed???


ShreeDevi
____________________________________________________________
भजन - कीर्तन - आरती @ http://bhajans.ramparivar.com

On Fri, Dec 5, 2014 at 9:42 PM, ShreeDevi Kumar <shree...@gmail.com> wrote:

Hariraam

unread,
Dec 8, 2014, 5:41:05 AM12/8/14
to technic...@googlegroups.com
Latest Standard IS:16500:2012 quoted point No. 4.6.2.3 attached.

We have to wait for next standards (perhaps on the basis/requirements of STT and TTS)


हरिराम
प्रगत भारत <http://hariraama.blogspot.com>

chandrabindu-4.6.2.3.jpg

ShreeDevi Kumar

unread,
Dec 8, 2014, 8:06:43 AM12/8/14
to technic...@googlegroups.com

ShreeDevi
____________________________________________________________
भजन - कीर्तन - आरती @ http://bhajans.ramparivar.com

ShreeDevi Kumar

unread,
Dec 19, 2014, 3:19:42 AM12/19/14
to technic...@googlegroups.com, mas...@gmail.com
cc:ing  Raj mas...@gmail.com who is developing gujarati hunspell dictionary

Update reg Hindi Hunspell:

FYI - it is still 'work-in-progress' and review and feedback is appreciated.

Please see :


Please let me know whether any additional rules need to be added here.

The verb root files that these rules apply to are:


I have started similar work on the nouns, the affix file with rules is

I would appreciate feedback on this also. I am still working on building the separate noun files.

Thanks.


ShreeDevi
____________________________________________________________
भजन - कीर्तन - आरती @ http://bhajans.ramparivar.com

Reply all
Reply to author
Forward
0 new messages