प्रभात बृहत् हिन्दी शब्दकोश में शब्दक्रम

296 views
Skip to first unread message

narayan prasad

unread,
Oct 5, 2013, 1:41:06 PM10/5/13
to Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)
श्री देवी कुमार के द्वारा भेजे गए सन्देश पर अभी तक कोई चर्चा नहीं हुई है । आशा है कि इस कोश की भूमिका में चर्चित शब्दक्रम पर कोई टीका-टिप्पणी अवश्य होगी ।

मुझे इसमें प्रयुक्त शब्दक्रम तो उचित प्रतीत होता है, सिवाय चन्द्रबिन्दु वाले अक्षरों के । आपलोगों की क्या राय है ?
--- नारायण प्रसाद
******************************************************************
from:     Shree Devi Kumar <shree...@gmail.com>
to:     technic...@googlegroups.com
date:     1 October 2013 16:01
subject:     Re: [technical-hindi] देवनागरी शाटन (sorting) के लिए प्रोग्राम

Anunadji,
Thanks for the program, I'll download and give it a try.
Since there was a question regarding the sorting order to be used for Hindi, I'm providing links to a recent Hindi Shabdakosh available in Google Books. It gives the order used in the two volumes as well as the logic for the same. You can provide that order also as one option, if you see fit. See pages 13-17 of Volume 1 in preview mode for the same.

Prabhat Brihat Hindi Shabdakosh (vol-2)

Prabhat Brihat Hindi Shabdakosh


narayan prasad

unread,
Oct 6, 2013, 4:13:47 AM10/6/13
to Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)

इस कोश की भूमिका में चर्चित शब्द-क्रम के सम्बन्ध में निम्नलिखित टिप्पणियाँ विशेष रूप से ध्यातव्य हैं -

(1) प्रचलित हिन्दी कोशों में शब्द-क्रम-सम्बन्धी जिस भ्रामक स्थिति को अपनाया गया है, उससे विदेशी हिन्दी-अध्येताओं को अधिक उलझन होती है, क्योंकि वे अपनी भाषा के कोशों में विद्यमान शुद्ध शब्द-क्रम के अभ्यस्त होते हैं । (पृ॰ तेरह, अन्तिम पैरा)

(2) अनुस्वार एक प्रकार की विशेष ध्वनि का चिह्न है जो स्वर से युक्त होकर और वर्णमाला के अन्तिम आठ व्यंजनों (य, , , , , , , ह) में से ही किसी के ठीक पहले आ सकती है । (पृ॰ पन्द्रह, अनुच्छेद 3)

(3) हिन्दी वर्णमाला में अनुस्वार का स्थान सुनिश्चित है - स्वरों के बाद और व्यंजनों से पहले । 'विशिष्ट हिन्दी शब्दकोश' में तदनुसार ही उसका स्थान है । ... अंश, अऋण और अतएव का कोशीय क्रम होना चाहिए - अऋण, अंश, अतएव ।  (पृ॰ पन्द्रह, अनुच्छेद 3)

(4) इन भ्रमित कोशकारों ने इस बात पर ध्यान नहीं दिया कि 'बन्दर' लिखो या 'बंदर', शब्दकोश में उसकी प्रविष्टि का स्थान तो एक ही रहना चाहिए । (पृ॰ सोलह, पैरा 2, अनुच्छेद 5)

(5) यह तो हास्यास्पद स्थिति ही है कि 'मङ्गल', 'चञ्चल', 'ठण्डा', 'सुन्दर', 'सम्पादक' को अशुद्ध कहा जाए और उनके स्थान पर क्रमशः 'मंगल', 'चंचल', 'ठंडा', 'सुंदर', 'संपादक' को शुद्ध । (पृ॰ सोलह, पैरा 3, अनुच्छेद 5)

(6) 'चन्द्रबिन्दु' से युक्त अनुनासिक स्वर हिन्दी भाषा की अपनी विशेषता है । यह संस्कृत इत्यादि से प्राप्त ध्वनि नहीं है । (पृ॰ सोलह,  अनुच्छेद 6)

(7) अनेक पूर्वप्रकाशित कोशों में चन्द्रबिन्दु, अनुस्वार और पंचम वर्ण की बिन्दी में कोई भेद न करने से शब्द-क्रम अशुद्ध हो गया है । (पृ॰ सोलह,  अनुच्छेद 6)

(8) '' के बाद आनेवाले द्वितीय वर्ण के क्रम में '' तक के शब्द हो जाने पर 'अँ' वाले शब्द रखे गए हैं, जैसे 'अँकटा', 'अँकटी', इत्यादि शब्द 'अहोरि-बहोरि' तथा अह्रीक के बाद हैं । इसी प्रकार 'आँ', ... 'औँ'  के विषय में समझना चाहिए । (पृ॰ सोलह,  अनुच्छेद 6)

--- नारायण प्रसाद



2013/10/5 narayan prasad <hin...@gmail.com>

Anubhav Chattoraj

unread,
Oct 6, 2013, 12:26:35 PM10/6/13
to technical-hindi
नारायण जी ने जिन टिप्पनियों पर ध्यान दिलाया है, वो सब बिंदी से ही संबंधित हैं। कोश में कई अन्य विषयों पर टिप्पणियाँ भी हैं:
१. व्यंजनाक्षरों को स्वरहीन-व्यंजन+स्वर मान के क्रम में रखा गया है। अर्थात् क् पहले आता है, फ़िर क, का, .., को, कौ, फ़िर क्क, क्ख, ..., क्ह।
२. अनुस्वार और विसर्ग को क्रमशः स्वरों के तत्काल बाद रखा गया है। अतः क के बाद कं आता है, फ़िर कः, फ़िर कक इत्यादि। का इन सब के बाद रखा जाता है। (लेकिन जब बिंदी पंचमाक्षर का रूप हो, तो उसे अनुस्वार नहीं, पंचमाक्षर मान के ही क्रम में रखा जाता है।)
३. चंद्रबिंदु को व्यंजनों के बाद रखा गया है। अतः कक, कख, ..., कह के बाद कँ आता है।
४. नुक्ते को आम तौर पर नज़रअंदाज़ कर दिया जाता है, लेकिन जब दो शब्दों में सिर्फ़ नुक्ते का अंतर हो, तब नुक्ते वाले शब्द को बाद में रखा जाता है।

अब प्रोग्रामिंग की दृष्टि से दो शब्द कहना चाहता हूँ।

टिप्पणी नंबर १, २, और ४ को प्रोग्राम में आसानी से इंप्लिमेंट किया जा सकता है। (पिछले थ्रेड पे इससे संबंधित चर्चा हो चुकी है।) लेकिन बिंदी और चंद्रबिंदु में भ्रम के कारण समस्या पैदा होती है।

देवनागरी में बिंदी के चार भिन्न प्रयोगों से अवगत हूँ। ये निम्न हैं:
१. किसी वर्ण के पंचमाक्षर (ङ्, ञ्, ण्, न्, म्) को दर्शाने के लिए। उदाहरण: पंकज, मंच, घंटी, मंद, कंपन इत्यादि।
२. अनुस्वार को दर्शाने के लिए। (बृहत् हिंदी कोश के अनुसार अनुस्वार सिर्फ़ अवार्गिक अक्षर अर्थात् य, र, ल, व, श, ष, स, ह के पहले ही आ सकता है। इस परिभाषा से कुछ लोग असहमत होंगे, लेकिन ये ज़ाहिर है कि अवार्गिक अक्षर से पहले आने वाली बिंदी के स्थान पर पंचमाक्षर नहीं लिख सकते।) उदाहरण: वंश, कंस, संयम इत्यादि।
३. अनुनासिक को दर्शाने के लिए। आम तौर पर यदि कोई मात्रा शिरोरेखा के ऊपर जाए, तब उसके साथ चंद्रबिंदु के स्थान पर बिंदी का प्रयोग ही किया जाता है। उदाहरण: खींच, में, हैं,इत्यादि।
४. (मराठी में) अ-कार दर्शाने के लिए। ये प्रयोग पारंपरिक नहीं है, लेकिन आजकल पाठ्यपुस्तकों, ब्लॉगों और अख़बारों में मिलता है। उदाहरण: माझं, डोकं इत्यादि।

चौथे प्रयोग का हिंदी से संबंध नहीं है, इसलिए इस पर अतिरिक्त चर्चा नहीं करूँगा।

बिंदी के सिर्फ़ पहले दो प्रयोग होते, तो प्रोग्राम करने में कोई समस्या नहीं होती। बस जहाँ भी बिंदी के बाद वार्गिक अक्षर मिलता, वहाँ बिंदी को उसी वर्ग का पंचमाक्षर मानके शाटन किया जा सकता था।

लेकिन तीसरे प्रयोग के कारण दुविधा उत्पन्न हो जाती है। बिंदी चंद्रबिंदु के स्थान पर प्रयुक्त हुई है या अनुस्वार/पंचमाक्षर के स्थान पर, ये सिर्फ़ वर्तनी देखकर नहीं बताया जा सकता। इनमें भेद करने के दो ही तरीकें हैं:
१. प्रोग्राम को शाटन के लिए शब्दसूची देने से पहले किसी इंसान को सभी बिंदी वाले शब्दो का विश्लेषण करना पड़ेगा, और यथोचित बिंदी को बदलके चंद्रबिंदु बनाना पड़ेगा। बृहत् हिंदी कोश में ऐसा ही किया गया है, लेकिन ये विधि पूरी तरह से ऑटोमैटिक नहीं है।
२. प्रोग्राम को हिंदी शब्दों का इतना ज्ञान दिया जाए कि वो खुद अनुनासिक वाले शब्दों को पहचान पाए। ये विधि ऑटोमैटिक तो है, लेकिन इसमें एक बड़ा मशीन लर्निंग/नैगुरल लैंग्वेज प्रोसेसिंग सिस्टम लगेगा, जिसे बनाना काफ़ी कठिन होगा।

जो भी विधि अपनाएँ, बिंदी के बहुतेरे प्रयोग शाटन में बाधा ही डालते हैं।

Vineet Chaitanya

unread,
Oct 7, 2013, 1:20:11 AM10/7/13
to technic...@googlegroups.com
१. प्रोग्राम को शाटन के लिए शब्दसूची देने से पहले किसी इंसान को सभी बिंदी वाले शब्दो का विश्लेषण करना पड़ेगा, और यथोचित बिंदी को बदलके चंद्रबिंदु बनाना पड़ेगा। बृहत् हिंदी कोश में ऐसा ही किया गया है, लेकिन ये विधि पूरी तरह से ऑटोमैटिक नहीं है।

 मेरे विचार से यदि उस हिन्दी कोश में मात्राओं के साथ जितने चन्द्रबिन्दु वाले शब्द हैं उन्हेँ प्रोग्राम को दे दिया जाय तो प्रोग्राम का एक उपयोगी संस्करण तैयार हो जायेगा जिसको समय समय पर सुविधानुसार परिष्कृत किया जा सकेगा.




2013/10/6 Anubhav Chattoraj <anubhav....@gmail.com>

--
आपको यह संदेश इसलिए प्राप्त हुआ क्योंकि आपने Google समूह "Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)" समूह की सदस्यता ली है.
इस समूह से अनसब्सक्राइब करने के लिए और इससे ईमेल प्राप्त करना बंद करने के लिए, technical-hin...@googlegroups.com को एक ईमेल भेजें.
अधिक विकल्‍पों के लिए, https://groups.google.com/groups/opt_out पर जाएं.

Anunad Singh

unread,
Oct 7, 2013, 5:02:38 AM10/7/13
to Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)
अनुभव जी ने जो अनुस्वार और चन्दबिन्दु आदि का विश्लेषण किया है वह एक प्रकार से शाटन से पूर्व  'वर्तनी जाँच एवं संशोधन'  का काम है।

मेरा प्र्शन है कि शाटन प्रोग्राम को जो सामग्री दी जाय उसको उसी रूप में स्वीकार करते हुए (उसे १००% शुद्ध मानते हुए) केवल शाटन का कार्य करना चाहिए। वर्तनी शुधीकरण का कार्य अलग कार्य है और उसे अलग प्रोग्रामों के द्वारा करना ठीक रहेगा।

और यदि वर्तनी शंशोधन करना ही है तो 'शुद्ध वर्तनियों की सूची' भी प्रोग्राम में डालनी पड़ेगी (जैसा विनीत चैतन्य जी ने संकेत दिया है)।

-- अनुनाद


2013/10/7 Vineet Chaitanya <v...@iiit.ac.in>
Boxbe This message is eligible for Automatic Cleanup! (v...@iiit.ac.in) Add cleanup rule | More info

१. प्रोग्राम को शाटन के लिए शब्दसूची देने से पहले किसी इंसान को सभी बिंदी वाले शब्दो का विश्लेषण करना पड़ेगा, और यथोचित बिंदी को बदलके चंद्रबिंदु बनाना पड़ेगा। बृहत् हिंदी कोश में ऐसा ही किया गया है, लेकिन ये विधि पूरी तरह से ऑटोमैटिक नहीं है।

 मेरे विचार से यदि उस हिन्दी कोश में मात्राओं के साथ जितने चन्द्रबिन्दु वाले शब्द हैं उन्हेँ प्रोग्राम को दे दिया जाय तो प्रोग्राम का एक उपयोगी संस्करण तैयार हो जायेगा जिसको समय समय पर सुविधानुसार परिष्कृत किया जा सकेगा.




2013/10/6 Anubhav Chattoraj <anubhav....@gmail.com>
नारायण जी ने जिन टिप्पनियों पर ध्यान दिलाया है, वो सब बिंदी से ही संबंधित हैं। कोश में कई अन्य विषयों पर टिप्पणियाँ भी हैं:

--
आपको यह संदेश इसलिए प्राप्त हुआ क्योंकि आपने Google समूह "Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)" समूह की सदस्यता ली है.
इस समूह से अनसब्सक्राइब करने के लिए और इससे ईमेल प्राप्त करना बंद करने के लिए, technical-hin...@googlegroups.com को एक ईमेल भेजें.
अधिक विकल्‍पों के लिए, https://groups.google.com/groups/opt_out पर जाएं.

--
आपको यह संदेश इसलिए प्राप्त हुआ क्योंकि आपने Google समूह "Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)" समूह की सदस्यता ली है.
इस समूह से अनसब्सक्राइब करने के लिए और इससे ईमेल प्राप्त करना बंद करने के लिए, technical-hin...@googlegroups.com को एक ईमेल भेजें.
अधिक विकल्‍पों के लिए, https://groups.google.com/groups/opt_out पर जाएं.




--
जब भी देश पर विपत्ति, जुल्म, गुलामी की मुसीबत आई है।
अपनी यह हिंदी ही काम आई है।
रामानंद और रामानुजाचार्य से लेकर
अन्ना तक सबने हिंदी ही अपनाई है।

V S Rawat

unread,
Oct 7, 2013, 4:46:04 AM10/7/13
to technic...@googlegroups.com
सिर्फ़ नुक्ते और बिंदी को ठीक करने के साथ में, किसी वृहद् शब्दकोश से सारे इनपुट शब्दों की
जाँच करके पहले ठीक किया जा सकता है, और सही पाए गए शब्दों को ही सॉर्ट किया जा
सकता है, बाकी शब्दों को नज़रअंदाज़ किया या हटाया जा सकता है।
-
यह जोक मारा था, या ताना कह लीजिए।
-
आप तो प्रूफ़रीडिंग करने निकल गए हैं, जब इतना सब कुछ कर रहे हैं तो क्यों नहीं, पूरा
अनुवाद का ही सॉफ़्टवेयर तैयार कर देते हैं? गूगल अनुवाद शत प्रतिशत सही अनुवाद नहीं करता
है ना।

मुझे नहीं चाहिए होगा बिंदी से चन्द्रबिन्दु का परिवर्तन। गूगल अनुवाद बिन्दी ही लगाता है
इसलिए मैं बिन्दी वाले शब्दों को ही क्लायंट को देने लगा हूँ। अब अगर किसी एक सॉर्टेड पाठ
में चन्द्रबिन्दु दिखा तो क्लायंट कनफ़्यूज़ हो जाएगा, या फिर मुझसे कहेगा सारे पाठों में
चन्द्रबिन्दु ही लगा कर दिया करो जिससे मेरा काम बढ़ेगा।

यह उदाहरण था कि अलग अलग लोगों की अलग-अलग दरकार हो सकती है। सॉर्टिंग प्रोग्राम
को इनपुट पाठ में किसी भी परिवर्तन या नज़रअंदाज़ करने का अधिकार नहीं होता है, उसे
सिर्फ़ इनपुट पाठ को क्रमबद्ध भर करना होता है।

धन्यवाद।
--
रावत


On 10/7/2013 10:50 AM, Vineet Chaitanya wrote:
> १. प्रोग्राम को शाटन के लिए शब्दसूची देने से पहले किसी इंसान को सभी बिंदी वाले शब्दो
> का विश्लेषण करना पड़ेगा, और यथोचित बिंदी को बदलके चंद्रबिंदु बनाना पड़ेगा। बृहत् हिंदी
> कोश में ऐसा ही किया गया है, लेकिन ये विधि पूरी तरह से ऑटोमैटिक नहीं है।
>
> मेरे विचार से यदि उस हिन्दी कोश में मात्राओं के साथ जितने चन्द्रबिन्दु वाले शब्द हैं उन्हेँ
> प्रोग्राम को दे दिया जाय तो प्रोग्राम का एक उपयोगी संस्करण तैयार हो जायेगा जिसको
> समय समय पर सुविधानुसार परिष्कृत किया जा सकेगा.
>
>
>
>
> 2013/10/6 Anubhav Chattoraj <anubhav....@gmail.com
> <mailto:anubhav....@gmail.com>>

Hariraam

unread,
Oct 7, 2013, 6:36:41 AM10/7/13
to technic...@googlegroups.com
अनुभव जी,
 
चन्द्रबिन्दु के स्थान पर अनुस्वार का प्रयोग करना मैनुअल टाइपराइटर युग तथा पुराने 8बिट फोंट आदि की मजबूरी वश प्रचलित हुआ था। वर्तमान युनिकोड समर्थित ओपेन टाइप फोंट में ऊपर की मात्राओं के साथ भी चन्द्रबिन्दु भली-भाँति प्रकट होता है।
 
यथा- मंगल फोंट में :
खीँचना, कौँच, कैँची, नहीँ, धौँकनी इत्यादि।
अरविन्द जी के समान्तर कोश में भी चन्द्रबिन्दु का सही प्रयोग हुआ है।
 
अतः चन्द्रबिन्दु के स्थान पर अनुस्वार के प्रयोग की गलती को वर्तनी शोधक (स्पेल चेकर) प्रोग्राम द्वारा ठीक किया जाना चाहिए। शाटन में इसके लिए अलग तर्क दिया जाना आवश्यक नहीं।
 
चन्द्रबिन्दु, अनुस्वार व विसर्ग को स्वर परिवर्तक (Vowel modifier) माना गया है। अतः इनका क्रम स्वर-मात्राओं के ठीक बाद में आता है।
 
यथा--
क का कि की कु कु कृ के कै को कौ
 
कँ काँ किँ कीँ कुँ कूँ कृँ केँ कैँ कोँ कौँ
 
कं कां किं कीं कुं कूं कृं कें कैं कों कौं
 
कः काः किः कीः कुः कूः कृः केः कैः कोः कौः
 
चन्द्रबिन्दु का स्वर-मान अनुस्वार से हल्का होने के कारण
शाटन क्रम में चन्द्रबिन्दु पहले
और अनुस्वार को बाद में आना चाहिए।
 
हरिराम

2013/10/6 Anubhav Chattoraj <anubhav....@gmail.com>
३. अनुनासिक को दर्शाने के लिए। आम तौर पर यदि कोई मात्रा शिरोरेखा के ऊपर जाए, तब उसके साथ चंद्रबिंदु के स्थान पर बिंदी का प्रयोग ही किया जाता है। उदाहरण: खींच, में, हैं,इत्यादि।
.....

Anubhav Chattoraj

unread,
Oct 7, 2013, 10:31:10 AM10/7/13
to technical-hindi
हरिराम जी,

आपने लिखा,

> अतः चन्द्रबिन्दु के स्थान पर अनुस्वार के प्रयोग की गलती को वर्तनी शोधक (स्पेल चेकर) प्रोग्राम द्वारा ठीक किया जाना चाहिए। शाटन में इसके लिए अलग तर्क दिया जाना आवश्यक नहीं।

सर्वव्यापक प्रयोग को "गलती" कहकर दुतकारना मुझे उचित नहीं लगता।

ऊपरी मात्राओं के साथ चंद्रबिंदु के स्थान पर हमेशा बिंदी ही लगाई जाती है, ये हिंदी लेखन का तथ्य है। ध्वनिविज्ञान के नज़रिए से शायद ये प्रयोग अवांछित है, लेकिन किसी भी भाषा की वर्तनी सिर्फ़ ध्वनि पे आधारित नहीं होती। हिंदी की वर्तनी भी पूर्णतः ध्वन्यात्मक नहीं है, अगर होती तो "क्यों" को "क्यूँ" लिखा जाता, "शक्ति" को "शक्ती", और "चेहरा" व "पहरा" की पहली मात्राएँ समान होती।

अगर इन सारे शब्दों की प्रचलित वर्तनियों को शुद्ध माना जाए, तो अनुनासिक को दर्शाने के लिए बिंदी के प्रयोग को किस बुनियाद पे गलत कहा जा सकता है? और अगर इन सब को अशुद्ध कहा जाए, तो स्पेलिंग रीफ़ॉर्म की बात बन जाती है, और स्पेलिंग रीफ़ॉर्म का समर्थन करना वर्तनी-जाँचक के धर्म से विपरीत है।

और तो और, आपने खुद अपने संदेश में "मात्राओं" और "में" शब्दों में अनुनासिक के लिए बिंदी का प्रयोग किया है। इन शब्दों को लिखते समय आपने दो बार सोचा भी न होगा, क्योंकि आम हिंदी-भाषी बिंदी वाली वर्तनियों को ही सही मानता है।

आपने लिखा,

> चन्द्रबिन्दु, अनुस्वार व विसर्ग को स्वर परिवर्तक (Vowel modifier) माना गया है। अतः इनका क्रम स्वर-मात्राओं के ठीक बाद में आता है।

इस बात पर आपसे सहमत हूँ, लेकिन लगता है आपसे क्रम लिखने में गलती हो गई है। क्या क्रम यथा--

क, कँ, कं, कः, का, काँ, कां, काः, ...

लिखना चाहते थें? "क" पर जो भी परिवर्तक लगाएँ, इसे तो "का" के पहले ही आना चाहिए।

Anubhav Chattoraj

unread,
Oct 7, 2013, 10:59:49 AM10/7/13
to technical-hindi
रावत जी,

आप गलत समझ रहे हैं। यहाँ इनपुट की बिंदी को आउटपुट में चंद्रबिंदु बनाने की बात नहीं हो रही।

प्रोग्राम में हर शब्द का एक रिप्रेसेंटेशन बनाके उसके हिसाब से शाटन किया जा सकता है। अनुस्वार-बिंदी और अनुनासिक-बिंदी में भेद करने वाले प्रोग्राम को सिर्फ़ ये रिप्रेसेंटेशन बदलना होगा। लेकिन ये रिप्रेसेंटेशन प्रोग्राम की आंतरिक बात होगी, बाहर वालों को मौलिक-शब्द ही देखने को मिलेगा। अगर इनपुट में शब्द में बिंदी है तो आउटपुट में भी बिंदी ही रहेगी।

पर चिंता न करें, प्रयोक्ता को असमंजस में डालने के लिए इस क्रम ने अन्य उपाय भी कर रखे हैं। प्रयोक्ता पाएगा कि बिंदी को कभी अनुस्वार मानकर स्वरों और व्यंजनों के बीच में रखा जाता है, कभी पंचमाक्षर मानकर व्यंजनों के साथ, और कभी अनुनासिक मानकर व्यंजनों के बाद।


2013/10/7 V S Rawat <vsr...@gmail.com>
सिर्फ़ नुक्ते और बिंदी को ठीक करने के साथ में, किसी वृहद् शब्दकोश से सारे इनपुट शब्दों की जाँच करके पहले ठीक किया जा सकता है, और सही पाए गए शब्दों को ही सॉर्ट किया जा सकता है, बाकी शब्दों को नज़रअंदाज़ किया या हटाया जा सकता है।
-
यह जोक मारा था, या ताना कह लीजिए।
-
आप तो प्रूफ़रीडिंग करने निकल गए हैं, जब इतना सब कुछ कर रहे हैं तो क्यों नहीं, पूरा अनुवाद का ही सॉफ़्टवेयर तैयार कर देते हैं? गूगल अनुवाद शत प्रतिशत सही अनुवाद नहीं करता है ना।

मुझे नहीं चाहिए होगा बिंदी से चन्द्रबिन्दु का परिवर्तन। गूगल अनुवाद बिन्दी ही लगाता है इसलिए मैं बिन्दी वाले शब्दों को ही क्लायंट को देने लगा हूँ। अब अगर किसी एक सॉर्टेड पाठ में चन्द्रबिन्दु दिखा तो क्लायंट कनफ़्यूज़ हो जाएगा, या फिर मुझसे कहेगा सारे पाठों में चन्द्रबिन्दु ही लगा कर दिया करो जिससे मेरा काम बढ़ेगा।

यह उदाहरण था कि अलग अलग लोगों की अलग-अलग दरकार हो सकती है। सॉर्टिंग प्रोग्राम को इनपुट पाठ में किसी भी परिवर्तन या नज़रअंदाज़ करने का अधिकार नहीं होता है, उसे सिर्फ़ इनपुट पाठ को क्रमबद्ध भर करना होता है।

धन्यवाद।
--
रावत



On 10/7/2013 10:50 AM, Vineet Chaitanya wrote:
१. प्रोग्राम को शाटन के लिए शब्दसूची देने से पहले किसी इंसान को सभी बिंदी वाले शब्दो
का विश्लेषण करना पड़ेगा, और यथोचित बिंदी को बदलके चंद्रबिंदु बनाना पड़ेगा। बृहत् हिंदी
कोश में ऐसा ही किया गया है, लेकिन ये विधि पूरी तरह से ऑटोमैटिक नहीं है।

  मेरे विचार से यदि उस हिन्दी कोश में मात्राओं के साथ जितने चन्द्रबिन्दु वाले शब्द हैं उन्हेँ
प्रोग्राम को दे दिया जाय तो प्रोग्राम का एक उपयोगी संस्करण तैयार हो जायेगा जिसको
समय समय पर सुविधानुसार परिष्कृत किया जा सकेगा.




2013/10/6 Anubhav Chattoraj <anubhav....@gmail.com
--
आपको यह संदेश इसलिए प्राप्त हुआ क्योंकि आपने Google समूह "Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)" समूह की सदस्यता ली है.
इस समूह से अनसब्सक्राइब करने के लिए और इससे ईमेल प्राप्त करना बंद करने के लिए, technical-hindi+unsubscribe@googlegroups.com को एक ईमेल भेजें.

V S Rawat

unread,
Oct 7, 2013, 11:30:29 AM10/7/13
to technic...@googlegroups.com
अगर आउटपुट, क्रम परिवर्तन के अलावा, वही होता है जो इनपुट में था, तो फिर तो मुझे
कोई भी ऐतराज नहीं है।

रावत

On 10/7/2013 8:29 PM, Anubhav Chattoraj wrote:
> रावत जी,
>
> आप गलत समझ रहे हैं। यहाँ इनपुट की बिंदी को आउटपुट में चंद्रबिंदु बनाने की बात नहीं हो रही।
>
> प्रोग्राम में हर शब्द का एक रिप्रेसेंटेशन बनाके उसके हिसाब से शाटन किया जा सकता है।
> अनुस्वार-बिंदी और अनुनासिक-बिंदी में भेद करने वाले प्रोग्राम को सिर्फ़ ये रिप्रेसेंटेशन
> बदलना होगा। लेकिन ये रिप्रेसेंटेशन प्रोग्राम की आंतरिक बात होगी, बाहर वालों को
> मौलिक-शब्द ही देखने को मिलेगा। अगर इनपुट में शब्द में बिंदी है तो आउटपुट में भी बिंदी ही
> रहेगी।
>
> पर चिंता न करें, प्रयोक्ता को असमंजस में डालने के लिए इस क्रम ने अन्य उपाय भी कर रखे
> हैं। प्रयोक्ता पाएगा कि बिंदी को कभी अनुस्वार मानकर स्वरों और व्यंजनों के बीच में रखा
> जाता है, कभी पंचमाक्षर मानकर व्यंजनों के साथ, और कभी अनुनासिक मानकर व्यंजनों के बाद।
>
>
> 2013/10/7 V S Rawat <vsr...@gmail.com <mailto:vsr...@gmail.com>>
> <mailto:anubhav....@gmail.com>
> <mailto:anubhav.chattoraj@__gmail.com
> <mailto:anubhav....@gmail.com>>>

Hariraam

unread,
Oct 8, 2013, 6:47:07 AM10/8/13
to technic...@googlegroups.com
सही है--
 
भाषा में आए 'विकार' को भी 'विकास' ही माना जाता है। टाइपराइटर युग की जरूरत के अनुसार समय की पुकार के अनुसार ऊपर की मात्राओं के साथ चन्द्रबिन्दु की जगह अनुस्वार के प्रयोग को पिछले मानकों में स्वीकार किया गया था।
 
यदि "आगामी" NLP की जरूरत के अनुसार समय की पुकार होगी तो सही प्रयोग कालक्रम में पुनः सही प्रयोग चल पड़ेगा।
 
वर्तमान समय में अधिकांश लोगों के प्रयोग के अभ्यास के मद्देनजर मानकों में लचीलापन रखना ही उचित होगा।
हरिराम


2013/10/7 Anubhav Chattoraj <anubhav....@gmail.com>

Hariraam

unread,
Oct 8, 2013, 6:57:02 AM10/8/13
to technic...@googlegroups.com
सही है, यही क्रम होना चाहिए।
 
क, कँ, कं, कः, का, काँ, कां, काः, ...
 
निम्न लिखने :--
 
क का कि की कु कु कृ के कै को कौ
कँ काँ किँ कीँ कुँ कूँ कृँ केँ कैँ कोँ कौँ
कं कां किं कीं कुं कूं कृं कें कैं कों कौं
कः काः किः कीः कुः कूः कृः केः कैः कोः कौः
से मेरा तात्पर्य यह है कि चन्द्रबिन्दु, अनुस्वार एवं विसर्ग हरेक मात्रायुक्त वर्ण पर लग सकते हैं,
जबकि पहली कक्षा में बारहखड़ी में यों पढ़ाया जाता है--
 
(1) क, (2) का, (3) कि, (4) की, (5) कु, (6) कू, (7)के, (8) कै, (9) को, (10) कौ, (11) कं, (12) कः
 
जो सिर्फ प्रतीकात्मक लगता है, किन्तु इससे बच्चे समझते हैं कि सिर्फ क पर ही अनुस्वार व विसर्ग लगते हैं।
 
हरिराम

2013/10/7 Anubhav Chattoraj <anubhav....@gmail.com>
क्या क्रम यथा--

Shree Devi Kumar

unread,
Oct 26, 2013, 6:04:57 AM10/26/13
to technic...@googlegroups.com
An alternate order for Hindi Dictionaries is given at http://pkhedar.uiwap.com/Gen.Hindi/varnvichar
It is quite different from Prabhat Brihat Hindi Shabdakosh.

हिन्दी शब्द–कोश मेँ शब्दोँ का क्रम –
       हिन्दी शब्द–कोश मेँ शब्दोँ का क्रम विभिन्न वर्णोँ के निम्न क्रम के अनुसार है–
अं, अ, आ, इ, ई, उ, ऊ, ऋ, ए, ऐ, ओ, औ, क, क्ष, ख, ग, घ, च, छ, ज, ज्ञ, झ, ट, ठ, ड, ढ, त, त्र, थ, द, ध, न, प, फ, ब, भ, म, य, र, ल, व, श, ष, स, ह ।
       इस प्रकार शब्द–कोश मेँ सर्वप्रथम ‘अं’ या ‘अँ’ से प्रारंभ होने वाले शब्द होते हैँ और अन्त मेँ ‘ह’ से प्रारंभ होने वाले शब्द। प्रत्येक शब्द से प्रारंभ होने वाले शब्द भी हजारोँ की संख्या मेँ होते हैँ, अतः शब्द–कोश मेँ उनका क्रम–विन्यास विभिन्न स्वरोँ की मात्राओँ के अग्र क्रम मेँ होता है–
ं ँ ा ि ी ु ू ृ े ै ो ौ ।
उदाहरण –
1. आधा वर्ण उस वर्ण की ‘औ’ की मात्रा के बाद आता है। जैसे– कटौती के बाद कट्टर, करौ के बाद कर्क, कसौ के बाद कस्त, कौस्तु के बाद क्य, क्योँ के बाद क्रं... क्र... क्ल... क्व आदि।
2. ‘ृ ’ की मात्रा ‘ऊ’ की मात्रा वाले वर्ण के बाद आती है। जैसे– कूक, कूल के बाद कृत।
3. ‘क्ष’ वर्ण आधे ‘क्’ के बाद आता है। जैसे– क्विँटल के बाद क्षण।
4. ‘ज्ञ’ अक्षर ‘जौ’ के अंतिम शब्द के बाद आता है। जैसे– जौहरी के बाद ज्ञात।
5. ‘त्र’ अक्षर ‘त्यौ’ के बाद आयेगा। जैसे– त्यौहार के बाद त्रय।
6. ‘श्र’ अक्षर ‘श्यो’ के बाद आयेगा क्योँकि श्र=श्*र है तथा ‘र’ शब्द–कोश मेँ ‘य’ के बाद आता है।
7. ‘द्य’ अक्षर ‘दौ’ के बाद आता है। जैसे– दौहित्री के बाद द्युति।
8. अक्षर ‘रौ’ के बाद आता है। जैसे– सरौता के बाद सर्कस एवं करौना के बाद कर्क।
9. अक्षर किसी भी व्यंजन के ‘य’ के साथ संयुक्त अक्षर के अंतिम शब्द के बाद आता है। जैसे– प्योसार के बाद प्रकट, ग्यारह के बाद ग्रंथ, द्यौ के बाद द्रव एवं ब्यौरा के बाद ब्रश।
       इस प्रकार प्रत्येक वर्ण के सर्वप्रथम अनुस्वार (ं ) या चन्द्रबिन्दु (ँ ) वाले शब्द आते हैँ फिर उनका क्रम क्रमशः अ, आ, इ, ई, उ, ऊ, ऋ, ए, ऐ, ओ, औ की मात्रा के अनुसार होता है। ‘औ’ की मात्रा के बाद आधे अक्षर से प्रारंभ होने वाले शब्द दिये होते हैँ। उदाहरणार्थ– ‘क’ से प्रारंभ होने वाले शब्दोँ का क्रम निम्न प्रकार रहेगा–
कं, क, कां, किँ, कि, कीँ, कुं, कु, कूं, कू, कृं, केँ, के, कैँ, कै, कोँ, को, कौँ, कौ, क् (आधा क) – क्या, क्रंद, क्रम आदि।

       प्रत्येक शब्द मेँ प्रथम अक्षर के बाद आने वाले द्वितीय, तृतीय आदि अक्षरोँ का क्रम भी उपर्युक्त प्रकार से ही होगा।



Shree Devi Kumar
____________________________________________________________
भजन - कीर्तन - आरती @ http://bhajans.ramparivar.com


2013/10/8 Hariraam <hari...@gmail.com>

--
आपको यह संदेश इसलिए प्राप्त हुआ क्योंकि आपने Google समूह "Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)" समूह की सदस्यता ली है.
इस समूह से अनसब्सक्राइब करने के लिए और इससे ईमेल प्राप्त करना बंद करने के लिए, technical-hin...@googlegroups.com को एक ईमेल भेजें.
Reply all
Reply to author
Forward
0 new messages