देवनागरी का मानकीकरण ( कम्प्यूटर की आन्तरिक प्रक्रमण व्यवस्था के लिए)

12 views
Skip to first unread message

narayan prasad

unread,
Aug 12, 2010, 10:02:37 AM8/12/10
to Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)
Ref: http://groups.google.com/group/technical-hindi/msg/51050e33261e4f22
 
<<वैसे भी कम्प्यूटर की आन्तरिक संसाधन व्यवस्था के लिए न ही मात्राओं की जरूरत है और न ही संयुक्ताक्षरों की।


बेहतर होगा कि हम स्वयं विद्वान मिलकर गैर-सरकारी संगठन रूप में अपना एक मानकीकरण संगठन गठित कर कार्यवाही करें। अपने मानकों का प्रचलन करें।>>

संसाधन = resource
प्रक्रम = process
प्रक्रमण = processing

हरिराम जी,
    आपका सुझाव बहुत अच्छा है ।
    पहले आप ही देवनागरी के मानकीकरण के लिए एक प्रारूप (draft) तैयार करें । फिर उस पर बहस की जाएगी ।
    कृपया पहले अन्दाज से यह बताएँ कि इसके लिए कितने code points की आवश्यकता होगी ।
---नारायण प्रसाद
************************************************************
from    Hariram <hari...@gmail.com>
to    technic...@googlegroups.com
date    12 August 2010 18:23
subject    Re: [technical-hindi] Re: युक्ताक्षर सम्बन्धी प्रश्नावली पर कृपया अपना मत दे

वैसे भी कम्प्यूटर की आन्तरिक संसाधन व्यवस्था के लिए न ही मात्राओं की जरूरत है और न ही संयुक्ताक्षरों की।
 
बेहतर होगा कि हम स्वयं विद्वान मिलकर गैर-सरकारी संगठन रूप में अपना एक मानकीकरण संगठन गठित कर कार्यवाही करें। अपने मानकों का प्रचलन करें।
 
-- हरिराम

Narayan Prasad

unread,
Aug 13, 2010, 4:09:08 AM8/13/10
to Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)
As indicated earlier, here are the related links of the messages under
this subject:

वी॰एस॰ रावत जी का सन्देश -
https://groups.google.com/group/technical-hindi/msg/e1e2a2a8d73a140a

मयूर दूबे जी का सन्देश -
https://groups.google.com/group/technical-hindi/msg/c2482596f7479877

वी॰एस॰ रावत जी का सन्देश -
https://groups.google.com/group/technical-hindi/msg/57dc47f90e044628

ई-पण्डित (श्रीश बेंजवाल शर्मा) जी का सन्देश -
https://groups.google.com/group/technical-hindi/msg/87b4c017772cf92e

काकेश कुमार जी का सन्देश -
https://groups.google.com/group/technical-hindi/msg/374a23bc7d8f59c7

----नारायण प्रसाद

Hariram

unread,
Aug 13, 2010, 2:40:22 PM8/13/10
to technic...@googlegroups.com
क्रमशः विभिन्न समस्याओं के समाधान विचार विमर्श के बाद निकाले जाएंगे।
 
सर्वप्रथम --
 
छोटी इ की मात्रा का बाईं ओर लगने की समस्या--
 
भारतीय लिपियों में वर्ण के चारों ओर ही नहीं, बल्कि दशों दिशाओं में मात्राएँ लगाने की व्यवस्था वैदिक काल से ही चली आई है। कुल मात्राएँ 16 होती हैं। जिनमें से वर्तमान प्रचलित
-- 8 मुख्य, (आ, इ, ई, उ, ऊ, ए, ऐ, ओ, औ)
-- 4 ऋ ॠ ऌ ॡ
-- 4 नए युनिकोडित ह्रस्व-अ(0904), ऎ, ऑ,,  (दक्षिण भारतीय लिपियों व अंग्रेजी से ली गईं) ,
 
-- शायद इसी के आधार पर वैदिक काल से हर पूजा के पहले षोड़श मात्रिका का पूजन करने की प्रथा चली आ रही है।
जो पाटे पर 16 खाने आटे से आँक कर उनमें गेहूँ के दाने रखकर की जाती है।

-- किन्तु वर्तमान युनिकोड में और एक और स्वर कोडित है -- ऍ अतः कुल मात्राओं की संख्या 17 हो गई हैं।
 
देवनागरी में
आ, ई, - की मात्रा दाहिनी ओर लगती है
उ ऊ ऋ ॠ ऌ ॡ - की मात्राएँ नीचे की ओर लगती हैं
ए ऐ ऎ ऍ - की मात्राएँ ऊपर की ओर लगती हैं
ओ औ, ऑ,, ऑ - की मात्राओं का कुछ हिस्सा दायीं ओर और कुछ हिस्सा ऊपर की ओर लगता है।
 
जो भी हो, ये सभी अक्षर के बाद में ही लगाईं जाती हैं।
 
सिर्फ ि की मात्रा ही बाईँ ओर लगती है।
बाईँ से दाहिनी ओर लिखी जाने की सरल परम्परा में यह एक समस्या है।
किन्तु बाईँ ओर लगने का मतलब वर्ण के 'पहले' लगना कदापि नहीं होता। कोई भी मात्रा किसी वर्ण के पहले लग ही नहीं सकती।
 
मैंने कई वैदिक पंडितों तथा अपने बुजुर्गों को लिखते वक्त देखा था कि वे पहले 'क' लिखते थे फिर बाद में उसके बाईं ओर ि की मात्रा ठूँस कर लगाते थे।
 
अन्य भारतीय लिपियों में तो मात्राओं की और भी गम्भीर समस्याएँ है। ओड़िआ में ଔ (औ) मात्रा तो वर्ण के तीन ओर तीन टुकड़ों में लगती है। (କୌ), दक्षिण भारतीय लिपियों में तो कुछ तो वर्ण के चारों ओर घेर कर लगती हैं। अधिकांश अन्य भारतीय लिपियों में तो खड़ी पाई या कणाकार अ मात्रा भी नहीं होती,  आधे अक्षर का कोई प्रावधान नहीं होता। संयुक्ताक्षरों के एकदम भिन्न रूप प्रकट होते हैं, जिनमें कई तो एकदम अवैज्ञानिक और बेसिर-पैर के लगते हैं।
 
अतः अन्य भारतीय लिपियों की तुलना में देवनागरी सबसे अधिक सरल है।
 
आज युनिकोड और कम्प्यूटर विज्ञान के विकसित युग में bidirectional complex scripts की भी प्रोसेसिंग आसानी होने लगी है। फिर देवनागरी की एक ि की मात्रा कोई समस्या नहीं है। inscript keyboard में 1988 से ही ऐसी व्यवस्था की गई है देवनागरी ि की मात्रा वर्ण के बाद में लगाई जाती है और वह replace होकर बाईँ ओर स्वतः प्रकट होती है।
 
हाँ, मैनुअल हिन्दी टाइपराइटर में मजबूरीवश ि की मात्रा को वर्ण के पहले टाइप करना पड़ता था।
 
हालांकि कई वर्षों से कम्प्यूटर में प्रयोग हेतु इस समस्या का समाधान तलाशा जा रहा था।
 
1992-93 में कुछ ऐसे ttf फोंट भी विकसित किए गए थे, जिनमें छोटी ि की मात्रा को दो टुकड़ों में बाँटा गया था, ऊपर की टोपी और नीचे का डंडा। नीचे का डंडा (लकीर) का फोंट वर्ण के पहले टाइप होता था और ऊपर की टोपी का फोंट वर्ण के बाद टाइप की जाती थी। सार्टिंग में नीचे के डंडे को ignore कर दिया जाता था। इस प्रकार 8 बिट ttf फोंट में भी देवबेस जैसे पुराने देवनागरी डैटाबेस सॉफ्टवेयर में भी perfect alphabetic sorting प्रदान की जा पा रही थी।
 
वर्तमान युनिकोडित ओपेन टाइप फोंट्स के glyph positioning के नियम में ऐसा सामान्य बदलाव करके कुछ सरलीकरण किया जा सकता है।
 
अतः यह कोई कठिनाई नहीं है।
 
वैदिक स्वर चिह्नों की भी युनिकोड में एनकोडिंग की जा रही है। देखें <http://tdil.mit.gov.in/prop_uni/Vedic.pdf> वैदिक स्वर तो कई हैं, यदि उनकी मात्राएँ वर्णों पर लगाईं जाएँ तो दसों दिशाओं में लगेंगी। फिर कैसे होगीं उनकी व्यवस्था? चिन्ता की बात नहीं, इसका भी समाधान निकाला जाएगा। और वह भी सिर्फ left to right की सरल व्यवस्था के माध्यम से ही।
 
देवनागरी का सरल रहस्य पाणिनी के "महेश्वर सूत्राणि" में ही मिल जाता है, बस समस्या उपजी है इनकी गलत-समझी के कारण। देखें <ttp://kkmishra10.blogspot.com>  तथा <ttp://en.wikipedia.org/wiki/Shiva_Sutra> लेकिन यहाँ कुछ त्रुटियाँ हैं, मूल व्यंजन में गलती से अ जोड़कर प्रकट किया गया है।)
 
देवनागरी 'र' का रहस्य (.. क्रमशः..... अगली कड़ी में)....
 (देवनगारी र का वर्तमान स्वरूप, रेफ का अगले अक्षर के ऊपर लगना, रु रू में मात्रा का दायें-मध्य में लगना, प्र, स्र, क्र, ग्र, घ्र, च्र,  .....  आदि में र-कार का नीचे लगना, त्र में अलग रूप में प्रकट होना, ट्र, ड्र, छ्र, ड्र, ढ्र आदि में नीचे अलग दोहरे रूप में लगना,  मराठी का अर्ध र (ऱ्य) मध्य में लगना, रि और ऋ, री और ॠ में क्या अन्तर है -- आदि वस्तुतः समस्याएँ लगतीं हैं, कितना रहस्यमय है ना 'र'। लेकिन ये कालक्रम में शीघ्र लेखन के मद्देनजर बने अपभ्रंश रूप के कारण उपजे हैं, बस, इसे समझने जरूरत है। संग्रहालयों में उपलब्ध प्राचीन शिलालेखों, तालपत्र भोजपत्र पोथियों से प्रकट होता है कि र भी कणाकार था, इसके संयुक्ताक्षर भी एकदम सरल थे....
.... प्रतीक्षा कीजिए)
 
---- हरिराम
प्रगत भारत http://hariraama.blogspot.com
 
2010/8/13 Narayan Prasad <hin...@gmail.com>

ePandit | ई-पण्डित

unread,
Aug 14, 2010, 12:22:42 PM8/14/10
to technic...@googlegroups.com
शायद इसी के आधार पर वैदिक काल से हर पूजा के पहले षोड़श मात्रिका का पूजन करने की प्रथा चली आ रही है।

ऊपर जो आपने  सोलह चिह्न गिनवाये हैं उनमें से ऑ तो हिन्दी मे बाद में आया है, फिर उन सोलह चिह्नों का सम्बंध षोडश मात्रिका से कैसे बैठता है?


वैदिक स्वर चिह्नों की भी युनिकोड में एनकोडिंग की जा रही है। देखें <http://tdil.mit.gov.in/prop_uni/Vedic.pdf>

हरिराम जी इनमें स्वस्तिक नहीं है, क्या स्वस्तिक चिह्न को शामिल किये जाने का प्रस्ताव नहीं है? यदि ऐसा है तो बहुत खेद का विषय है क्योंकि ये तो हमारी संस्कृति एक प्रमुख चिह्न है।


देवनागरी 'र' का रहस्य (.. क्रमशः..... अगली कड़ी में).

कृपया एतद् सम्बंधी लेख अपने ब्लॉग पर लिखें ताकि उसका विभिन्न स्थानों पर सन्दर्भ दिया जा सके।
 

१४ अगस्त २०१० १२:१० पूर्वाह्न को, Hariram <hari...@gmail.com> ने लिखा:

--
आपको यह संदेश इसलिए प्राप्त हुआ क्योंकि आपने Google समूह "Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)" समूह की सदस्यता ली है.
इस समूह में पोस्ट करने के लिए, technic...@googlegroups.com को ईमेल भेजें.
इस समूह से सदस्यता समाप्त करने के लिए, technical-hin...@googlegroups.com को ईमेल करें.
और विकल्पों के लिए, http://groups.google.com/group/technical-hindi?hl=hi पर इस समूह पर जाएं.



--
Shrish Benjwal Sharma (श्रीश बेंजवाल शर्मा)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
If u can't beat them, join them.

ePandit: http://epandit.shrish.in/

narayan prasad

unread,
Aug 14, 2010, 1:48:07 PM8/14/10
to Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)
Ref: http://groups.google.com/group/technical-hindi/msg/51050e33261e4f22

<< यदि आधे अक्षर और 'अ' की मात्रा निराकार(invisible) और कण रूप में कोडित होती तो

स्व = s+w+a = स् (आधे रूप में खड़ी पाई रहित) + व् (आधे रूप में खड़ी पाई रूप में) + अ(खड़ी पाई रूप में) ही टंकित/प्रोसेसिंग करना पड़ता। जैसा कि हिन्दी टाइपराइटर में श्‍ख्‍ आदि के लिए आज भी किया जाता है।

हाँ 8 कण (खड़ी पाई रहित) व्यंजनों के नए आधे रूप निर्धारित करने पड़ेगे अवश्य... >>

शब्दों की sorting के बारे में भी किसी प्रकार का परिवर्तन करना है ? आप वाक् शब्द को पहले रखना चाहेंगे या वाकई को ? यदि वाक् को पहले रखते हैं तो सरल (अर्थात् हल-चिह्न रहित) शब्दों को बाद में और युक्ताक्षरों को पहले रखना पड़ेगा जो परम्परा के विरुद्ध होगा ।

Hariram

unread,
Aug 14, 2010, 2:43:02 PM8/14/10
to technic...@googlegroups.com
" आप वाक् शब्द को पहले रखना चाहेंगे या वाकई को ? यदि वाक् को पहले रखते हैं तो सरल (अर्थात् हल-चिह्न रहित) शब्दों को बाद में और युक्ताक्षरों को पहले रखना पड़ेगा जो परम्परा के विरुद्ध होगा।"
 
नारायण जी,
संस्कृत की शब्द रूप परम्परा के अनुसार 'वाक्' का मान 'वाक' से कम है, अतः पहले 'वाक्' ही आना चाहिए।
यही तो समस्या है वर्तमान युनिकोड कूटों में। 'क्' दो कूटों से मिलकर बनता है, जबकि वैज्ञानिक दृष्टि से यह आधे कूट के बराबर है।
इसीलिए मूल व्यंजनों (अ-ध्वनि रहित व्यंजनों) के कूट-निर्धारण की नितान्त आवश्यकता है। इसके बिना पाणिनी के शब्द रूप, प्रत्यय विधान, विभक्ति विधान के समस्त वैज्ञानिक सूत्रों की कम्प्यूटिंग गलत हो जाती है, लिपि ही अपंग हो जाती है।
 
-- हरिराम


2010/8/14 narayan prasad <hin...@gmail.com>

Hariram

unread,
Aug 14, 2010, 2:47:46 PM8/14/10
to technic...@googlegroups.com


2010/8/14 ePandit | ई-पण्डित <sharma...@gmail.com>

शायद इसी के आधार पर वैदिक काल से हर पूजा के पहले षोड़श मात्रिका का पूजन करने की प्रथा चली आ रही है।

ऊपर जो आपने  सोलह चिह्न गिनवाये हैं उनमें से ऑ तो हिन्दी मे बाद में आया है, फिर उन सोलह चिह्नों का सम्बंध षोडश मात्रिका से कैसे बैठता है?
 
इसीलिए "शायद" शब्द का प्रयोग किया है, प्रारम्भ में। वैदिक मौलिक 16 स्वर कौन से थे, इस पर शोध किया जाना है।
 
 
 

वैदिक स्वर चिह्नों की भी युनिकोड में एनकोडिंग की जा रही है। देखें <http://tdil.mit.gov.in/prop_uni/Vedic.pdf>
हरिराम जी इनमें स्वस्तिक नहीं है, क्या स्वस्तिक चिह्न को शामिल किये जाने का प्रस्ताव नहीं है? यदि ऐसा है तो बहुत खेद का विषय है क्योंकि ये तो हमारी संस्कृति एक प्रमुख चिह्न है।
 
स्वस्तिक केवल वैदिक चिह्न ही नहीं, अनेक अन्य देशों लिपियों में भी इसका प्रयोग होता है। युनिकोड में इसकी कोडिंग अन्य चिह्नों के अन्तर्गत हुई है। मैं सही कोड नम्बर समय निकाल कर देखकर बता पाऊँगा।
 

देवनागरी 'र' का रहस्य (.. क्रमशः..... अगली कड़ी में).

कृपया एतद् सम्बंधी लेख अपने ब्लॉग पर लिखें ताकि उसका विभिन्न स्थानों पर सन्दर्भ दिया जा सके।
 
OK, ठीक है जी।
 
-- हरिराम
 
Reply all
Reply to author
Forward
0 new messages