कश्मीरी वर्णमाला

570 views
Skip to first unread message

Anubhav Chattoraj

unread,
Oct 29, 2013, 12:08:51 PM10/29/13
to technic...@googlegroups.com

कश्मीरी पारंपरिक रूप से अरबी लिपि में लिखी जाती है, लेकिन आजकल कश्मीरी पंडितों में इसे देवनागरी में लिखने का चलन है।

अपने सॉर्टिंग प्रोग्राम के संबंध में शोध करने के दौरान मुझे पता चला कि सन् २००२ में मानव संसाधन विकास मंत्रालय के अधीन उत्तरी क्षेत्रीय भाषा केंद्र ने कश्मीरी-नागरी की मानक वर्णमाला निर्धारित की थी

ये वर्णमाला निम्न है:

अ ॲ ॶ ॷ आ ऑ इ ई उ ऊ ऋ ए ऎ ऐ ओ ऒ औ 
अं ्य ्व

क ख ग
च छ ज
च़ छ़ ज़
ट ठ ड
त थ द न
प फ ब म

य र ल व
श स ह
त्र

इसकी कुछ विशेषताओं पर आपका ध्यान दिलाना चाहता हूँ:

  • कश्मीर की विशेष स्वर-ध्वनियों के लिए दो नए अक्षर इजाद किए गए हैं: और । (इन्हें पर गुरमुखी और की मात्राएँ लगाकर बनाया गया है।)
  • य और व जब किसी संयुक्ताक्षर के दूसरे भाग में आते हैं, तब इन्हें स्वार माना जाता हैं, अन्यथा व्यंजन।
  • (ह्रस्व ए) और (ह्रस्व ओ) संगत दीर्घ अक्षर के पहले नहीं, बाद में रखे जाते हैं।
  • और क्रमशः और के बाद रखे गए हैं, क्योंकि ये अक्षर अपनी पारंपरिक ध्वनियों को न दर्शाकर क्रमशः दीर्घ अ और ह्रस्व आ को दर्शाते हैं। (हाल ही में इस समूह में इन अक्षरों पर चर्चा हुई थी, जिसमें इनके लिए वर्णमाला में चार संभव स्थान पाए गए थे। इसे पाँचवा समझ लीजिए।)
  • पारंपरिक पाँच वर्गों के साथ एक छठा च़वर्ग भी है।
  • घोष महाप्राण व्यंजन (घ, झ, ढ, ध, भ) कश्मीरी भाषा में नहीं पाए जाते, इसलिए इन्हें वर्णमाला में भी शामिल नहीं किया गया है।
  • पहले तीन पंचमाक्षर (ङ, ञ, ण) सिर्फ़ संयुक्ताक्षरों में सवर्ग अक्षरों के पहले पाए जाते हैं। इस स्थिति में इन्हें अनुस्वार से दर्शाया जाता है; इनके स्वतंत्र अक्षर वर्णमाला में शामिल नहीं किए गए हैं।
  • -वर्ण को भी शामिल नहीं किया गया है।
  • और त्र स्वतंत्र अक्षरों के रूप में सम्मिलित हैं। (बाकी अनावश्यक वर्णों को धिक्कारने वाले इस वर्णमाला के निर्माताओं पर इन दो वर्णों का कौन-सा मोह आ गया, मुझे नहीं पता।)

लेकिन इस वर्णमाला की सबसे बड़ी विशेषता ये है कि ये हर सात साल में बदलती है।

मैंने जिस वर्णमाला का विवरण किया वो २००२ में तय हुई थी। इससे पहले १९९५ में भी एक वर्णमाला निर्धारित हुई थी, जिसमें कॅ, कॉ, कॖ, कॗ, कॆ, कॊ के स्थान पर क्रमशः कऽ, काʼ, कॅु, कॅू, केʼ, कोʼ लिखे जाते थे।

२००२ के ठीक सात साल बाद, २००९ में पुनः नई वर्णमाला बनाई गई। इस यूनिकोड प्रस्ताव के आखिरी दो पन्नों में इसका विवरण है। ॲ, ऑ, ऐ, औ, अनुस्वार, विसर्ग, और त्र को वर्णमाला से निकाल दिया गया है, और अब स्वरों की श्रणी में शामिल नहीं हैं, अपने पारंपरिक स्थान पर यथावत् स्थापित दिखते हैं। ज़ वर्णमाला के निर्माताओं को इतना पसंद आया कि इसे एक नहीं, दो-दो स्थान दिए गए हैं।

और स्वरों की तो पूरी रूपरेखा ही बदल चुकी है। स्वरमाला अब इस प्रकार दिखती है:

अ, आ, इ, ई, उ, ऊ, ॶ, ॷ, ॳ, ॴ, ॵ, ऎ, ऒ, ऋ, ए, ओ

अब तो और संगत दीर्घ स्वरों के आस-पास भी नहीं हैं।

इस नई वर्णमाला में अपनी पारंपरिक ध्वनि को न दर्शाकर ह्रस्व-आ की ध्वनि को दर्शाता है। की पारंपरिक ध्वनि से दर्शाई जाती है।

की पारंपरिक ध्वनि ह्रस्व-औ है, लेकिन यहाँ ये की पारंपरिक ध्वनि दर्शाने के लिए प्रयुक्त होता है। पर का इस्तेमाल भी तो नहीं कर सकते थे न, क्योंकि २००२-०९ के दौरान से ह्रस्व-आ दर्शाया जाता था। २००९ में इसकी ध्वनि बदल दी जाती तो कश्मीरी लिखने-पढ़ने वाले कनफ़्यूज़ हो जाते।

(वो तो वैसे भी कनफ़्यूज़ हुए ही होंगे, क्योंकि २००२ का २००९ में बन गया है, और २००९ का २००२ में था। लेकिन अभी इस बात की चर्चा छोड़ देते हैं।)

लोग कहते हैं कि हमारे देश में इनोवेशन नहीं होता, लेकिन भारत सरकार तो कश्मीरी नागरी के साथ हर सात साल में इनोवेशन कर रही है।

नवीनतम संस्करण २०१६ में निकलेगा। सिर्फ़ तीन साल बचे हैं। इस बार भारत सरकार के “विशेषज्ञ” अपनी क्रिएटिविटी किस रूप में प्रदर्शित करेंगे, देखने के लिए उत्सुक हूँ।

(एक और बात: अपने प्रोग्राम में कश्मीरी सॉर्टिंग का प्रबंध करने का फ़िलहाल कोई इरादा नहीं है।)

Shree Devi Kumar

unread,
Oct 29, 2013, 12:34:55 PM10/29/13
to technic...@googlegroups.com
Very interesting!

Though this confusion regarding the Kashmiri alphabet has been going on for a long time, since 1898 ... see http://dsalsrv02.uchicago.edu/cgi-bin/philologic/getobject.pl?p.0:6.grierson - when Grierson decided to use the engliah alphabetic order for his Kashmiri dictionary.

Kāshmīrīs use three alphabets for writing their language. Hindūs as a rule employ either the Śāradā or the Nāgarī character, and Musalmāns the Persian. The spelling of Kāshmīrī words written in the Persian character has the advantage of being fairly constant, but the alphabet is quite unsuited for illustrating the complicated vowel sounds of the language. I have therefore decided not to use it except in the case of words borrowed from Persian. Even such words, when forming part of the Hindū vocabulary, and evidenced as such by being included in the Paṇḍits' slips, are also written in Nāgarī. As for the Śāradā character, no types are available, nor, as a rule, are European students familiar with it, and I have therefore written all words not purely Musalmān in Nāgarī. But in this case another difficulty has arisen. No two Hindūs spell Kāshmīrī alike in that form of script. Every man is a law unto himself. I have in my possession two Nāgarī manuscripts of the same work -- the Śiva Pariṇaya; and as an example of the various modes of spelling I here give the same passage transcribed from each.
MS. A. इन्द्राज़स् य्यलि ख&above;तु&below; अन्धकारो । ज़ोरन््ति गोस् लूरपारयो ॥
MS. B. इन्द्राजस् इलि खुत् अन्दकारु । जुरन्ति गुस् लोरपारयु ॥
MS. A. म्वकलाव् थन् छुख् च़&dotbelow;्ह् बख््च्यन््हारो । महागणपत ध्यान् दारयो ॥
MS. B. मुक्लाव् तन् छ्योख् च़ूह् भखच्यन््हारु । महागणपत ध्यान् दारयु ॥
Now a dictionary must follow one system of spelling throughout, and I have, accordingly, in the present work followed, with one or two slight alterations, that of Īśvara Kaula, the best and most logical of all those used for Kāshmīrī. But it is obvious that, however excellent its system of spelling may be, a dictionary that follows the conventional order of the Nāgarī alphabet will be of little use to the student of works that diverge so widely from the standard as does MS. B. Twelve out of the fifteen words given in the extract would not be found in their proper places, and would have to be searched for under another orthography. It will be observed from a comparison of the two extracts that most of the variations occur in the representation of vowel sounds. Consonantal variations are few, and can easily be made subject to one or two general rules. This is true of all systems. After much consideration and many experiments, I therefore decided, as the most practical course, to make the romanized transliteration the basis of the alphabetical order, and to arrange the words in the approximate order of the English consonants, without any regard to the vowels. Thus, whether a word is spelt kōmu, kom, kāmu, kömü, orkạ̄mi, it will occupy the same place in the Dictionary, its place being determined by the k and the m and by nothing else. Only in those cases in which several words have all the same consonants, and differ only in their vocalization, will the order of the vowels be taken into account. As regards words beginning with vowels, these are all grouped together at the beginning, the order in the group being determined by the consonants. Then will follow all words beginning with b, then those beginning with c, and so on. In order to serve as a check against misprints, after every Kāshmīrī word in the roman character, I have given it again either in the Nāgarī character, according to the spelling of Īśvara Kaula, or, in the case of words directly borrowed from Persian, in the Persian character. This is usually followed by its Sanskrit translation and then by its meaning in English.
The following is the order of the vowels when appearing in different words of which the consonantal skeleton is the same: -- a, ȧ, a, ạ, ȧ, ā; ai; au; ĕ, ĕ, ẹ̆, ë˘, ē; i, i, ī; o, ŏ, ọ̆, ŏ̈ o, ō, ô, ö; u, u, ū, ü, ü, ṻ.� � Anunāsika is represented by ~, and does not affect the order of words. Anusvāra si represented by m or n according to pronunciation. The Sanskrit vowels ṛu (ऋ) and ṛĕ (modified ऋ&above;) are arranged (in the forms, respectively, of ruand rĕ) among consonants under r, with which, in writing, they are quite commonly confounded.
The following is the order of the consonants: -- b, c (ch), d and ḍ, f, g, h, j, k (kh), l, m, n, ñ, p (ph), r, s (sh), t (th) and ṭ (ṭh), ʦ (ʦh), v (or w), y, z. But the following points must be noted. The aspirates ch, kh, ph, th, and ṭh, and also the sibilant sh, appear in their English alphabetical order. Thus ch comes between cg and cj, and sh between sg and sj (vowels being neglected as usual). I would draw especial attention to this, as I find that some who have consulted the Dictionary have been misled by failing to remember that, in the case of ch, kh, ph, sh, th, ṭh, and ʦh, for the purposes of English alphabetical sequence, these respective groups have each been dissolved into its component typographical parts, and are not to be considered as so many single letters, as in the Nāgarī छ्, ख्, फ्, ष्, थ्, ठ्, and छ्&dotbelow; respectively.
1 It will be observed that these are separated into groups, each separated by a semicolon. I must confess that, when the consonantal framework of a number of words has been the same, I have not always exactly followed the order of the vowels within each group, being sometimes led to disregard that by practical questions of convenience of reference. This will not, I hope, give rise to any serious misapprehension.
The letter n represents the Arabic and the Nāgarī न्. It also represents (in Kāshmīrī words) the Nāgarī ङ्, ञ्, and ण्, when these are compounded with another consonant of the same class. Thus, ङ्ग nga, ञ्च nca, ण्ट nṭa. The letters ङ and ण occur in Kāshmīrī only in such circumstances. They never, except in paṇḍits' 'learned' spelling, stand alone. In quoting Sanskrit words the usual transliteration (ṅa, ña, and ṇa) is, of course, observed. When the Nāgarī letter ञ् stands alone in a Kāshmīrī word it has nearly the sound of ny, and is represented in the Persian character by . In this Dictionary it is represented by ñ, as in ब्यञ bĕñĕ. This ñ is not classed for purposes of alphabetical order with n, but comes after it as a distinct letter. This is rendered necessary by the fact that many people actually represent ñ by ny, and to class it with n would cause great confusion. On the other hand, for the purpose of alphabetical order, d and  are classed as the same letter, and so are t (including th) and  (including ṭh). The letters v and w are for the purpose of alphabetical order treated as the same letter.
The letter sh represents the Persian , and also two distinct Nāgarī (or Śāradā) letters, viz. श् and ष्. Of the two latter, ष् is merely a grammarian's figment, used by some paṇḍits in writing words derived from Sanskrit words containing it. Thus such persons write pōsh, a flower, पोष्, not पोश्, because it is derived from पुष्पं. In Kāshmīrī श् and ष् are both pronounced sh, as in 'shine', and there is no danger in representing them both in the roman character bysh, as the Nāgarī spelling is also given in every case. To write ś and  would only puzzle those who read texts edited on the usual system of representing the sound by sh. In transliterating Sanskrit words, I of course retain the customary ś and ṣ.
The character ʦ is an innovation. It represents the affricative sound of c represented in Nāgarī by च़&dotbelow; and in the Persian character by , which is very common in Kāshmīrī and other languages of North-Western India. I have introduced the character ʦ in order to show that in the vernacular character the sound is represented by one letter, and also to distinguish it from ts (त्स्, ), an altogether different sound. Its aspirated form is ʦh, which is sounded asts + h, not as t + sh.



Shree Devi Kumar
____________________________________________________________
भजन - कीर्तन - आरती @ http://bhajans.ramparivar.com


2013/10/29 Anubhav Chattoraj <anubhav....@gmail.com>

--
आपको यह संदेश इसलिए प्राप्त हुआ क्योंकि आपने Google समूह "Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)" समूह की सदस्यता ली है.
इस समूह से अनसब्सक्राइब करने के लिए और इससे ईमेल प्राप्त करना बंद करने के लिए, technical-hin...@googlegroups.com को एक ईमेल भेजें.
अधिक विकल्‍पों के लिए, https://groups.google.com/groups/opt_out पर जाएं.

V S Rawat

unread,
Oct 29, 2013, 12:51:54 PM10/29/13
to technic...@googlegroups.com
डोंगरी और कश्मीरी में क्या अंतर हुआ?

यूनीकोड में हिन्दी विस्तार में कुछ वर्ण कश्मीरी के लिए भी शामिल हैं ना।

रावत

On 10/29/2013 9:38 PM, Anubhav Chattoraj wrote:
> कश्मीरी पारंपरिक रूप से अरबी लिपि में लिखी जाती है, लेकिन आजकल कश्मीरी पंडितों में इसे
> देवनागरी में लिखने का चलन है।
>
> अपने सॉर्टिंग प्रोग्राम
> <http://anubhav-chattoraj.github.io/indic-tools/devanagari_sorter/> के
> संबंध में शोध करने के दौरान मुझे पता चला कि सन् २००२ में मानव संसाधन विकास मंत्रालय के
> अधीन उत्तरी क्षेत्रीय भाषा केंद्र ने कश्मीरी-नागरी की मानक वर्णमाला निर्धारित की थी
> <http://www.koausa.org/Reader/intro.html>।
>
> ये वर्णमाला निम्न है:
>
> |अ ॲ ॶ ॷ आ ऑ इ ई उ ऊ ऋ ए ऎ ऐ ओ ऒ औ
> अं ्य ्व
>
> क ख ग
> च छ ज
> च़ छ़ ज़
> ट ठ ड
> त थ द न
> प फ ब म
>
> य र ल व
> श स ह
> त्र|
>
> इसकी कुछ विशेषताओं पर आपका ध्यान दिलाना चाहता हूँ:
>
> * कश्मीर की विशेष स्वर-ध्वनियों के लिए दो नए अक्षर इजाद किए गए हैं: |ॶ| और |ॷ|।
> (इन्हें |अ| पर गुरमुखी |उ| और |ऊ| की मात्राएँ लगाकर बनाया गया है।)
> * य और व जब किसी संयुक्ताक्षर के दूसरे भाग में आते हैं, तब इन्हें स्वार माना जाता हैं,
> अन्यथा व्यंजन।
> * |ऎ| (ह्रस्व ए) और |ऒ| (ह्रस्व ओ) संगत दीर्घ अक्षर के पहले नहीं, बाद में रखे जाते हैं।
> * |ॲ| और |ऑ| क्रमशः |अ| और |आ| के बाद रखे गए हैं, क्योंकि ये अक्षर अपनी पारंपरिक
> ध्वनियों को न दर्शाकर क्रमशः दीर्घ अ और ह्रस्व आ को दर्शाते हैं। (हाल ही में इस
> समूह में इन अक्षरों पर चर्चा हुई थी, जिसमें इनके लिए वर्णमाला में चार संभव स्थान
> पाए गए थे। इसे पाँचवा समझ लीजिए।)
> * पारंपरिक पाँच वर्गों के साथ एक छठा |च़|वर्ग भी है।
> * घोष महाप्राण व्यंजन (|घ, झ, ढ, ध, भ|) कश्मीरी भाषा में नहीं पाए जाते, इसलिए
> इन्हें वर्णमाला में भी शामिल नहीं किया गया है।
> * पहले तीन पंचमाक्षर (|ङ, ञ, ण|) सिर्फ़ संयुक्ताक्षरों में सवर्ग अक्षरों के पहले पाए
> जाते हैं। इस स्थिति में इन्हें अनुस्वार से दर्शाया जाता है; इनके स्वतंत्र अक्षर वर्णमाला
> में शामिल नहीं किए गए हैं।
> * |ष|-वर्ण को भी शामिल नहीं किया गया है।
> * |ऋ| और |त्र| स्वतंत्र अक्षरों के रूप में सम्मिलित हैं। (बाकी अनावश्यक वर्णों को
> धिक्कारने वाले इस वर्णमाला के निर्माताओं पर इन दो वर्णों का कौन-सा मोह आ गया,
> मुझे नहीं पता।)
>
> लेकिन इस वर्णमाला की सबसे बड़ी विशेषता ये है कि ये हर सात साल में बदलती है।
>
> मैंने जिस वर्णमाला का विवरण किया वो २००२ में तय हुई थी। इससे पहले १९९५ में भी एक
> वर्णमाला निर्धारित हुई थी, जिसमें |कॅ, कॉ, कॖ, कॗ, कॆ, कॊ| के स्थान पर क्रमशः |कऽ,
> काʼ, कॅु, कॅू, केʼ, कोʼ| लिखे जाते थे।
>
> २००२ के ठीक सात साल बाद, २००९ में पुनः नई वर्णमाला बनाई गई। इस यूनिकोड प्रस्ताव
> <http://www.unicode.org/L2/L2009/09369-n3710.pdf> के आखिरी दो पन्नों में इसका
> विवरण है। |ॲ, ऑ, ऐ, औ|, अनुस्वार, विसर्ग, और |त्र| को वर्णमाला से निकाल दिया
> गया है, |य| और |व| अब स्वरों की श्रणी में शामिल नहीं हैं, |ञ| अपने पारंपरिक स्थान पर
> यथावत् स्थापित दिखते हैं। |ज़| वर्णमाला के निर्माताओं को इतना पसंद आया कि इसे एक
> नहीं, दो-दो स्थान दिए गए हैं।
>
> और स्वरों की तो पूरी रूपरेखा ही बदल चुकी है। स्वरमाला अब इस प्रकार दिखती है:
>
> |अ, आ, इ, ई, उ, ऊ, ॶ, ॷ, ॳ, ॴ, ॵ, ऎ, ऒ, ऋ, ए, ओ|
>
> अब तो |ऎ| और |ऒ| संगत दीर्घ स्वरों के आस-पास भी नहीं हैं।
>
> इस नई वर्णमाला में |अ| अपनी पारंपरिक ध्वनि को न दर्शाकर ह्रस्व-आ की ध्वनि को
> दर्शाता है। |अ| की पारंपरिक ध्वनि |ॳ| से दर्शाई जाती है।
>
> |ॵ| की पारंपरिक ध्वनि ह्रस्व-औ है, लेकिन यहाँ ये |ऑ| की पारंपरिक ध्वनि दर्शाने के लिए
> प्रयुक्त होता है। पर |ऑ| का इस्तेमाल भी तो नहीं कर सकते थे न, क्योंकि २००२-०९ के
> दौरान |ऑ| से ह्रस्व-आ दर्शाया जाता था। २००९ में इसकी ध्वनि बदल दी जाती तो
> कश्मीरी लिखने-पढ़ने वाले कनफ़्यूज़ हो जाते।
>
> (वो तो वैसे भी कनफ़्यूज़ हुए ही होंगे, क्योंकि २००२ का |अ| २००९ में |ॳ| बन गया है, और
> २००९ का |अ| २००२ में |ऑ| था। लेकिन अभी इस बात की चर्चा छोड़ देते हैं।)
>
> लोग कहते हैं कि हमारे देश में इनोवेशन नहीं होता, लेकिन भारत सरकार तो कश्मीरी नागरी
> के साथ हर सात साल में इनोवेशन कर रही है।
>
> नवीनतम संस्करण २०१६ में निकलेगा। सिर्फ़ तीन साल बचे हैं। इस बार भारत सरकार के
> “विशेषज्ञ” अपनी क्रिएटिविटी किस रूप में प्रदर्शित करेंगे, देखने के लिए उत्सुक हूँ।
>
> /(एक और बात: अपने प्रोग्राम में कश्मीरी सॉर्टिंग का प्रबंध करने का फ़िलहाल कोई इरादा
> नहीं है।)/

Anubhav Chattoraj

unread,
Oct 29, 2013, 1:11:20 PM10/29/13
to technic...@googlegroups.com
> Hindūs as a rule employ either the Śāradā or the Nāgarī character,
and Musalmāns the Persian.

Interesting. I thought Kashmiri was written only in Perso-Arabic until a
few decades ago.

Shree Devi Kumar

unread,
Oct 29, 2013, 1:10:47 PM10/29/13
to technic...@googlegroups.com
Dogri is पहाड़ी - spoken mainly in Jammu region

कश्मीरी = कॉशुर - spoken mainly in kashmir valley


Shree Devi Kumar
____________________________________________________________
भजन - कीर्तन - आरती @ http://bhajans.ramparivar.com


2013/10/29 Shree Devi Kumar <shree...@gmail.com>

Shree Devi Kumar

unread,
Oct 29, 2013, 1:40:04 PM10/29/13
to technic...@googlegroups.com
"Nepal and Kashmir in the North and Tanjore and Travancore in the South are known to contain vast treasures of unpublished and valuable Sanskrit manuscripts;
​"​


In fact during Mahabharata's critical edition project at BORI in Pune they found the Kashmiri/Sarada manuscripts to be some of the more accurate ones.

Shree Devi Kumar
____________________________________________________________
भजन - कीर्तन - आरती @ http://bhajans.ramparivar.com


2013/10/29 Anubhav Chattoraj <anubhav....@gmail.com>
> Hindūs as a rule employ either the Śāradā or the Nāgarī character, and Musalmāns the Persian.

Interesting. I thought Kashmiri was written only in Perso-Arabic until a few decades ago.
--
आपको यह संदेश इसलिए प्राप्त हुआ क्योंकि आपने Google समूह "Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)" समूह की सदस्यता ली है.
इस समूह से अनसब्सक्राइब करने के लिए और इससे ईमेल प्राप्त करना बंद करने के लिए, technical-hindi+unsubscribe@googlegroups.com को एक ईमेल भेजें.
Reply all
Reply to author
Forward
0 new messages