देवनागरी शाटन का प्रोग्राम संलग्न है। इससे आरोही या अवरोही क्रम में
देवनागरी का शाटन कर सकते हैं।
--
आपको यह संदेश इसलिए प्राप्त हुआ क्योंकि आपने Google समूह "Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)" समूह की सदस्यता ली है.
इस समूह से अनसब्सक्राइब करने के लिए और इससे ईमेल प्राप्त करना बंद करने के लिए, technical-hin...@googlegroups.com को एक ईमेल भेजें.
अधिक विकल्पों के लिए, https://groups.google.com/groups/opt_out पर जाएं.
देवनागरी शाटन का प्रोग्राम संलग्न है। इससे आरोही या अवरोही क्रम में
देवनागरी का शाटन कर सकते हैं।
धर्मेन्द्र जी से सहमति। अनुनाद जी, आपकी सेवा प्रशंसनीय है।
डॉ. मधु(सूदन) झवेरी
----- Original Message -----
From: Dharmendra Pare <dharmen...@gmail.com>
To: technic...@googlegroups.com
Sent: Fri, 27 Sep 2013 23:12:22 -0400 (EDT)
प्रतिलोम शाटन प्रोग्राम बिलकुल नहीं काम कर रहा । मैं शाटन हेतु एक पूरी कहानी ही डाल दी, जिसमें करीब डेढ़ हजार शब्द हैं । परन्तु प्रोग्राम केवल पहले वाक्य के शब्दों को ग्रहण कर रहा है । उसमें भी शाटन का कार्य बिलकुल नहीं हो रहा ।
--- नारायण प्रसाद
--
आपको यह संदेश इसलिए प्राप्त हुआ क्योंकि आपने Google समूह "Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)" समूह की सदस्यता ली है.
इस समूह से अनसब्सक्राइब करने के लिए और इससे ईमेल प्राप्त करना बंद करने के लिए, technical-hin...@googlegroups.com को एक ईमेल भेजें.
अधिक विकल्पों के लिए, https://groups.google.com/groups/opt_out पर जाएं.
On 9/27/2013 11:14 PM, Anunad Singh wrote:
देवनागरी शाटन का प्रोग्राम संलग्न है। इससे आरोही या अवरोही क्रम में
देवनागरी का शाटन कर सकते हैं।
--
आपको यह संदेश इसलिए प्राप्त हुआ क्योंकि आपने Google समूह "Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)" समूह की सदस्यता ली है.
इस समूह से अनसब्सक्राइब करने के लिए और इससे ईमेल प्राप्त करना बंद करने के लिए, technical-hindi+unsubscribe@googlegroups.com को एक ईमेल भेजें.
अधिक विकल्पों के लिए, https://groups.google.com/groups/opt_out पर जाएं.
![]()
This message is eligible for Automatic Cleanup! (anubhav....@gmail.com) Add cleanup rule | More info
अनुनाद जी, आपका कोड थोड़ा लंबा लगा, इसलिए मैंने कुछ बदलाव किए। संलग्न
फ़ाइल देखिए।
2013/9/27 Anunad Singh <anu...@gmail.com>:
> देवनागरी शाटन का प्रोग्राम संलग्न है। इससे आरोही या अवरोही क्रम में
> देवनागरी का शाटन कर सकते हैं।
>
> --
> आपको यह संदेश इसलिए प्राप्त हुआ क्योंकि आपने Google समूह "Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)" समूह की सदस्यता ली है.
> इस समूह से अनसब्सक्राइब करने के लिए और इससे ईमेल प्राप्त करना बंद करने के लिए, technical-hin...@googlegroups.com को एक ईमेल भेजें.
> अधिक विकल्पों के लिए, https://groups.google.com/groups/opt_out पर जाएं.
--
आपको यह संदेश इसलिए प्राप्त हुआ क्योंकि आपने Google समूह "Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)" समूह की सदस्यता ली है.
इस समूह से अनसब्सक्राइब करने के लिए और इससे ईमेल प्राप्त करना बंद करने के लिए, technical-hin...@googlegroups.com को एक ईमेल भेजें.
अधिक विकल्पों के लिए, https://groups.google.com/groups/opt_out पर जाएं.
Q: What about collation of Indic language data? Is that just a binary sort?
http://www.unicode.org/faq/indic.html
A: No. Collation order is not the same as code point order. A good treatment of some issues specific to collation in Indic languages can be found in the paper Issues in Indic Language Collation by Cathy Wissink.
Collation in general must proceed at the level of language or language variant, not at the script or codepoint levels. See also UTS #10: Unicode Collation Algortihm. Some Indic-specific issues are also discussed in that report.
इस प्रोग्राम को वस्तुतः उपयोगी बनाने के लिए कृपया 'शब्दावली निर्माण' (अर्थात् प्रत्येक शब्द का एक ही बार चयन) हेतु संशोधित संस्करण शीघ्रातिशीघ्र तैयार करें । शब्दों की बारम्बारता (frequency) बाद के संस्करणों में दी जा सकती है ।
--- नारायण प्रसाद
--
आपको यह संदेश इसलिए प्राप्त हुआ क्योंकि आपने Google समूह "Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)" समूह की सदस्यता ली है.
इस समूह से अनसब्सक्राइब करने के लिए और इससे ईमेल प्राप्त करना बंद करने के लिए, technical-hin...@googlegroups.com को एक ईमेल भेजें.
अधिक विकल्पों के लिए, https://groups.google.com/groups/opt_out पर जाएं.
| ॐ 0950 | |||||||
| ॲ 0972 |
|||||||
| ऄ 0904 | |||||||
| अ 0905 | |||||||
|
आ 0906 | |||||||
| ॳ 0973 | |||||||
| ॴ 0974 | |||||||
|
ॵ 0975 | |||||||
| ॶ 0976 | |||||||
| ॷ 0977 | |||||||
|
इ 0907 | |||||||
| ई 0908 | |||||||
| उ 0909 | |||||||
|
ऊ 090A | |||||||
| ऋ 090B | |||||||
| ॠ 0960 | |||||||
| ऌ 090C | |||||||
| ॡ 0961 | |||||||
|
ऍ 090D | |||||||
| ऎ 090E | |||||||
| ए 090F | |||||||
|
ऐ 0910 | |||||||
| ऑ 0911 | |||||||
| ऒ 0912 | |||||||
| ओ 0913 | |||||||
| औ 0914 | |||||||
|
क 0915 | क़ 0958 | ||||||
| ख 0916 |
ख़ 0959 | ||||||
| ग 0917 | ग़ 095A | ||||||
|
ॻ 097B | |||||||
| घ 0918 | |||||||
| ङ 0919 | |||||||
|
च 091A | |||||||
| छ 091B | |||||||
| ज 091C |
ज़ 095B | ||||||
| ॹ 0979 | |||||||
| ॼ 097C | |||||||
|
झ 091D | |||||||
| ञ 091E | |||||||
| ट 091F | |||||||
|
ठ 0920 | |||||||
| ड 0921 | ड़ 095C | ||||||
|
ॾ 097E | |||||||
| ढ 0922 | ढ़ 095D | ||||||
|
ण 0923 | |||||||
| त 0924 | |||||||
| थ 0925 | |||||||
|
द 0926 | |||||||
| ध 0927 | |||||||
| न 0928 |
ऩ 0929 | ||||||
| प 092A | |||||||
| फ 092B |
फ़ 095E | ||||||
| ब 092C | |||||||
| ॿ 097F | |||||||
|
भ 092D | |||||||
| म 092E | |||||||
| य 092F |
य़ 095F | ||||||
| ॺ 097A | |||||||
| र 0930 |
ऱ 0931 | ||||||
| ल 0932 | |||||||
| ळ 0933 |
ऴ 0934 | ||||||
| व 0935 | |||||||
| श 0936 | |||||||
|
ष 0937 | |||||||
| स 0938 | |||||||
| ह 0939 | |||||||
|
ऽ 093D | |||||||
| ॽ 097D | |||||||
| ᳩ 1CE9 |
ᳪ 1CEA | ᳫ 1CEB |
ᳬ 1CEC | ᳮ 1CEE | ᳯ 1CEF |
ᳰ 1CF0 | ᳱ 1CF1 |
| ᳵ 1CF5 | |||||||
|
ᳶ 1CF6 | |||||||
| ꣲ A8F2 | ꣳ A8F3 |
ꣴ A8F4 | ꣵ A8F5 |
ꣶ A8F6 | ꣷ A8F7 | ||
| ꣻ A8FB | |||||||
|
◌ा 093E | |||||||
| ◌ऺ 093A | |||||||
| ◌ऻ 093B | |||||||
| ◌ॏ 094F | |||||||
| ◌ॖ 0956 | |||||||
|
◌ॗ 0957 | |||||||
| ◌ि 093F | |||||||
| ◌ी 0940 | |||||||
|
◌ु 0941 | |||||||
| ◌ू 0942 | |||||||
| ◌ृ 0943 | |||||||
| ◌ॄ 0944 | |||||||
| ◌ॢ 0962 | |||||||
|
◌ॣ 0963 | |||||||
| ◌ॅ 0945 | |||||||
| ◌ॕ 0955 |
|||||||
| ◌ॆ 0946 | |||||||
| ◌े 0947 | |||||||
|
◌ॎ 094E | |||||||
| ◌ै 0948 | |||||||
| ◌ॉ 0949 | |||||||
| ◌ॊ 094A | |||||||
| ◌ो 094B | |||||||
|
◌ौ 094C | |||||||
| ◌् 094D |
उपरोक्त सभी चर्चाओं को ध्यान में रखते हुए, सारांश रूप में निम्नलिखित बातें कहना चाहूँगा:
(१) सम्स्कृत/हिन्दी के शाटन का कोई मानक नहीं है। (जबकि सिंहल, बर्मी भाषा, तिब्बती, थाई आदि के शाटन से सम्बन्धित दस्तावेज नेट पर उपलब्ध हैं।)
(२) देवनागरी के मानकीकरण पर चर्चा (जिसमें शाटन भी एक मुद्दा था) चली थी (अन्यत्र) जो अधूरी रह गई थी।
अनुनाद जी,
मेरा कथन ऐसा नहीं है।कृपया मेरा सन्देश पुनः देखें। पुनः स्पष्ट करता हूँ।"चूँकि युनिकोड में देवनागरी व अन्य भारतीय लिपियों में मूल व्यञ्जनों की Encoding नहीं हुई है, अतः यह समस्या है।"
--
यूनिकोड कान्सोर्शियम बार-बार स्पष्ट करता है कि किसी भाषा के शाटन का क्रम का निर्धारण उनका काम नहीं है और न ही वे ऐसा करते हैं। हाँ, मोटे तौर पर देवनागरी यूनिकोड या अन्य लिपियों के यूनिकोड इस प्रकार निर्धारित किए गए हैं कि उनसे आभास (भ्रम?) होता है कि यूनिकोड कॉन्सोर्शियम ने ये कोड शाटन के क्रम में निर्धारित किया है किन्तु कुछ-कुछ गलती कर दी है।
यूनिकोड कांसोर्शियम का यही कहना है कि कोडिंग और शार्टिंग को अलग-अलग देखा जाय, दोनों को मिश्रित न किया जाय। 'देवनागरी का शाटन कोई समस्या नहीं है'। बल्कि समस्या यह है कि हम ही किसी एक शाटन क्रम पर एकमत नहीं हो पा रहे।
Anunadji,Thanks for the program, I'll download and give it a try.
Since there was a question regarding the sorting order to be used for Hindi, I'm providing links to a recent Hindi Shabdakosh available in Google Books. It gives the order used in the two volumes as well as the logic for the same. You can provide that order also as one option, if you see fit. See pages 13-17 of Volume 1 in preview mode for the same.
Prabhat Brihat Hindi Shabdakosh
Dictionary of Hindi language.
Shree Devi Kumar
____________________________________________________________
युनिकोड में देवनागरी का जो शाटन चार्ट निर्धारित है, वह निम्नवत् है। यहाँ देखें।
हरिराम जी,आपने लिखा था
युनिकोड में देवनागरी का जो शाटन चार्ट निर्धारित है, वह निम्नवत् है। यहाँ देखें।
मुझसे गलती हो गई कि मैने इसे ध्यान से नहीं देखा। वस्तुतः यह विशाल 'डिफाल्ट यूनिकोड कोलेशन एलिमेण्ट टेबल' (DUCET) का वह भाग है जो देवनागरी से सम्बन्धित है। इसके बारे में मैं निम्नलिखित बातें कहना चाहता हूँ-
उड़िया में - ल ळ ( ଲ ଳ )
तमिल में - ल ऴ ळ ( ல ழ ள )
तेलुगु में - ल ळ ( ల ళ )
कन्नड में - ल ऴ ळ ( ಲ ೞ ಳ )
मलयालम में - ल ऴ ळ ( ല ഴ ള )
--
# # This file defines the Default Unicode Collation Element Table
[reorder Deva Beng Guru Gujr Orya Taml Telu Knda Mlym Sinh]
&ॐ<ा<ि<ी<ु<ू<ृ<ॅ<े<ै<ॉ<ो<ौ<ं<ँ<ः
&[before 1]
क<क्
क्
क्
क्
क़
क्ळ
क़्
कृ
कॉ
कॅ
कं
कँ
क
कः
का
कि
की
कु
कू
के
को
कै
कौ
कृ
Maybe the rule needs << instead of < in the first line with maatraas
Shree Devi Kumar
Yes, since it is critical information that many OS, programs, and applications depend on, one would need official documents, national standards to back up your requests for corrections. It requires strong persuasion, convincing data for Unicode consortium to approve changes.
Quan Nguyen 4:20 AM (7 hours ago)Reply
to me
1.6 Alphabetical order and sorting of SanskritAlthough standard alphabetical ordering of Sanskrit is clear, if not always adhered to{Cf. the ordering of words in Mylius 1992, see esp. pp. 497ff.} it may be useful to givehere the sorting sequences, especially as the sequence is not quite straightforward. Forcomputer searching sorting is less imoprtant as processor power increases, but formerging different word lists as well as for checking/correcting of entries it is quiteuseful.
The sorting sequence is:Vowels:a A i I u U R RR lR lRR e ai o au
AnusvAra + [yrlvzSs]:My Mr Ml Mv Mz MS Ms
Visarga:H
AnusvAra in final position:M
Consonants:k kh g gh G j jh J T Th D(L) Dh(Lh) N t th d dh n p ph b bh m y r l v z S s h
AnusvAra before the following consonants have to be converted to homorganic nasalsbefore sorting:Mk=Gk Mg=Gg Mc=Jc Mj=Jj MT=NT MD=ND Mt=nt Mn=nn Mp=mp Mb=mbMm=mm
AnunAsika is equivalent to AnusvAra.
Avagraha is equivalent to a or is ignored(?).Combinations of primary vowels a-i, a-u, A-i, A-u are sorted as single primary vowels(thus MW {prau0ga} (p. 652,3) before {prauga} (p. 714,2) {prakaGkata} and{mAu0tha} before {mAkanda}).
In the case of Hindithe following is the traditional sort order as determined by theexpertsand used in dictionaries.अआइईउऊऋएऍऐओऑऔकखगघङचछजझञटठडढणतथदधनपफबभमयरलवशषसह
The order as given below is pertinent to sorting by a computer program and is compliant
with CLDR as laid down by Unicode and W3C.
ँ
ंं ं
ः
ा
ि
ी
ु
ू
ृ
े
ॅ
ै
ो
ॉ
ौ
्
़