8-बिट फोंट-कोड का मानकीकरण

117 views
Skip to first unread message

narayan prasad

unread,
Apr 14, 2011, 1:58:07 AM4/14/11
to Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)
अभी तक इस विषय पर विशेष चर्चा नहीं हुई । एक ही विषय पर एक से अधिक चर्चा समूह और अलग-अलग शीर्षक हो जाने से मामला पेचीदा होता जा रहा है । इसलिए इसे तकनीकी-हिन्दी समूह पर ही इस विषय पर अपने विचार रख रहा हूँ ।

(1) पुराने फोंट के परिवर्तक बनाते समय मुझे सबसे ज्यादा दिक्कत उन कूट बिन्दुओं पर रखे गए देवनागरी वर्ण/ वर्णखंडों के परिवर्तन में हुई जिनका प्रयोग तकनीकी रूप से अनुपयुक्त या अवैध है, क्योंकि ऐसे कूट बिन्दु कुछ विशेष कार्य के लिए रिज़र्व रखे गए हैं । ये कूट बिन्दु हैं -
  127, 128-129, 141-144, 157-158

Ulrich Stiehl ने itranslator99 के प्रयोग के लिए जो itmanual.pdf तैयार किया है उसमें Sanskrit99 फोंट के बारे में निम्नलिखित टिप्पणी की है -

The codes 127, 128-129, 141-144, 157-158 (not used in original TTF and PS fonts) have been left empty, because characters in these slots are often
skipped by printer drivers.


विस्तृत चर्चा के लिए देखें -
Font Converters vs Codes 127, 128-129, 141-144, 157-158

(2) 8-बिट कोड में कुल कूट बिन्दुओं की संख्या (शून्य को छोड़कर) = 2**8 - 1 = 255
16-बिट कोड में कुल कूट बिन्दुओं की संख्या (शून्य को छोड़कर) = 2**16 - 1 = 65535

कूट बिन्दु 32 रिक्त स्थान के लिए है । चूँकि इसका प्रयोग सभी भाषाओं में होता है, इसलिए इसे ऐसे ही छोड़ देना ठीक रहेगा । अतः 8-बिट कोड में कुल 255 कूट बिन्दुओं में से प्रथम बत्तीस और कूट बिन्दु 127, 128-129, 141-144, 157-158 (अर्थात् कुल नौ)  को हटा देने पर शेष उपलब्ध कूट बिन्दु = 255 - 32  - 9 = 214.

कूट बिन्दु 33-64, 91-96, 182  (कुल उनचालीस) का प्रयोग भारतीय लिपियों में भी किया जाता है । मेरे विचार में कूट बिन्दु 159-177 (कुल उन्नीस) का प्रयोग भी वांछित नहीं है ।

अतः 8-बिट फोंट-कोड के मानकीकरण के लिए कुल उपलब्ध कूट बिन्दु = 214 - 39 - 19 = 156

अब इन उपलब्ध 156 कूट बिन्दुओं में ही सभी देवनगरी वर्णों और वर्णखंडों को रखना है । इनमें से 128 का प्रयोग यूनिकोड में प्रदत्त क्रम को ही रखा जाय तो आगे भी आसानी रहेगी । शेष 156-128 =  28 कूट बिन्दु में अधिक से अधिक प्रयुक्त युक्ताक्षर वर्णों को रखा जा सकता है । यूनिकोड में जो कूट बिन्दु देवनागरी में रिक्त रखे गए हैं उन्हें अभी के लिए रिक्त ही छोड़ देना चाहिए । उनमें से कुछ रिक्त क्रम में अन्य भारतीय लिपियों के चिह्नों का प्रयोग किया जाता है जो देवनागरी में अनुपलब्ध हैं ।

---नारायण प्रसाद 

narayan prasad

unread,
Apr 14, 2011, 3:48:47 AM4/14/11
to Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)

8-बिट अयूनिकोड फोंट हेतु यूनिकोड में उपलब्ध ग्लिफ के अतिरिक्त विशेष चिह्नों की सूची

(कृपया अन्य छूटे हुए ग्लिफ जोड़ें)

*************************************

विशेष अक्षर जो युक्ताक्षर नहीं हैं

 

"ड़","ढ़","रु","रू",

"शृ" (जिसमें श प्राचीन रूप वाला है जैसे श्री में),

"हृ",

*************************************

युक्ताक्षर (अधिक प्रचलित) - वर्णक्रमानुसार

 

"क्ष",

"ङ्क","ङ्ख","ङ्ग","ङ्घ",

"ज्ञ",

"ञ्च","ञ्ज",

"ट्ट","ट्ठ",

"ड्ड","ड्ढ",

"त्त","त्र", 

"द्घ","द्द","द्ध","द्म","द्य","द्व",

"प्त",

"श्र",

"ष्ट","ष्ट्र","ष्ठ",

"स्त्र","स्र",

"ह्ण","ह्न","ह्म","ह्र","ह्ल","ह्व",

 

"्य" (जैसे - "पाठ्य" में )

"्र" (जैसे - "क्र", "प्र" में )

"्र" (जैसे - "छ्र", "ट्र", "ड्र" में )

"र्" (रेफ, जैसे - "कर्म" में)

*************************************

Hariraam

unread,
Apr 14, 2011, 4:14:30 AM4/14/11
to technic...@googlegroups.com
  127, 128-129, 141-144, 157-158
 
के अलावा भी कुछ स्थान browser के कुछ कमांड्स के लिए रिजर्व किए गए हैं। उन्हें भी खाली रखना होगा।
 
-- हरिराम

2011/4/14 narayan prasad <hin...@gmail.com>
--
आपको यह संदेश इसलिए प्राप्त हुआ क्योंकि आपने Google समूह "Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)" समूह की सदस्यता ली है.
इस समूह में पोस्ट करने के लिए, technic...@googlegroups.com को ईमेल भेजें.
इस समूह से सदस्यता समाप्त करने के लिए, technical-hin...@googlegroups.com को ईमेल करें.
और विकल्पों के लिए, http://groups.google.com/group/technical-hindi?hl=hi पर इस समूह पर जाएं.



--
हरिराम
प्रगत भारत <http://hariraama.blogspot.com>
(सड़कों के किनारे, बाजारों के बीच, बस्तियों के बीच कूड़ा-करकट जलाकर वायु-प्रदूषण फैलाने वालों का कड़ा विरोध करें।)

Anunad Singh

unread,
Apr 14, 2011, 5:29:23 AM4/14/11
to technic...@googlegroups.com
आपके ये चिन्तन बिन्दु बहुत उपयोगी हैं। यदि कुछ इसी तरह का चिन्तन पुराने फॉण्टों की डिजाइन के पूर्व किया गया होता तो समस्याएँ बहुत कम होंती। मुझे तो लगता है कि उस समय यह  विचार भी किसी को नहीं आया था कि कभी 'फाण्ट परिवर्तक' नाम की वस्तु पैदा होगी।

खैर अभी मैं देख नहीं पा रहा कि कभी भविष्य में  कहाँ किसी 8-बिट फॉण्ट की नये सिरे से आवश्यकता पड़ेगी। किन्तु इसे नकारा नहीं जा सकता। यदि कभी इसकी जरूरत पड़ी, तो आप द्वारा सुझाये गये बिन्दुओं के अलावा निम्नलिखित  बातों का ध्यान भी रखना उपयोगी होगा-

१)  फॉण्ट को यूनिकोड में बदलने की विधि (एल्गोरिद्म)  सरल हो।
२) इसमें अपवादों  के लिये जगह न हो।
३) देवनागरी के अधिकाधिक (लगभग सभी) चिह्नों का समावेश  किया जा सके।
४) कोडों में अनावश्यक दोहराव न हो और यह कम से कम स्थान (किलोबाइट) घेरे।

-- अनुनाद सिंह

----------------------

१४ अप्रैल २०११ ११:२८ पूर्वाह्न को, narayan prasad <hin...@gmail.com> ने लिखा:

narayan prasad

unread,
Apr 14, 2011, 9:03:26 AM4/14/11
to technic...@googlegroups.com
<< 127, 128-129, 141-144, 157-158
 
के अलावा भी कुछ स्थान browser के कुछ कमांड्स के लिए रिजर्व किए गए हैं। उन्हें भी खाली रखना होगा।>>

कौन से स्थान ?

---नारायण प्रसाद

2011/4/14 Hariraam <hari...@gmail.com>

narayan prasad

unread,
Apr 14, 2011, 9:11:26 AM4/14/11
to Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)
अयूनिकोड फोंट में शुद्ध व्यंजन (साधारणतः दंड-सहित वर्ण को दंड रहित बनाकर) को भी रखना ही पड़ेगा ।
Sanskrit-99 फोंट को नमूने के तौर पर लेकर इसमें से अवांछित चिह्नों को हटाकर पूरी सूची तैयार की जा सकती है ।

---नारायण प्रसाद

2011/4/14 narayan prasad <hin...@gmail.com>

8-बिट अयूनिकोड फोंट हेतु यूनिकोड में उपलब्ध ग्लिफ के अतिरिक्त विशेष चिह्नों की सूची

(कृपया अन्य छूटे हुए ग्लिफ जोड़ें)

---------Message curtailed ---------

ePandit | ई-पण्डित

unread,
Apr 14, 2011, 12:26:39 PM4/14/11
to technic...@googlegroups.com
सही कहा शुद्ध व्यंजन रखना जरुरी होगा क्योंकि 8 बिट फॉण्ट में संयुक्ताक्षरों हेतु सीमित स्थान होंगे जिससे हमें कइयों को सरल रुप में प्रदर्शित करने हेतु हलन्त वर्ण रखने पड़ेंगे।

रही बात संयुक्ताक्षरों की तो अनावश्यक संयुक्ताक्षर कम किये जा सकते हैं तथा पहले केवल आवश्यक संयुक्ताक्षरों को रखा जा सकता है। जैसे चाणक्य में "ष्ट्व" टाइप कुछ ज्यादा लम्बे संयुक्ताक्षर हैं जिन्हें शुरु में छोड़ा जा सकता है।

यहाँ नारायण जी का सुझाव सही है कि संस्कृत-९९ फॉण्ट को नमूने के तौर पर लिया जाय क्योंकि इसमें मेरे विचार से सर्वाधिक संयुक्ताक्षर हैं।

१४ अप्रैल २०११ ६:४१ अपराह्न को, narayan prasad <hin...@gmail.com> ने लिखा:

--
आपको यह संदेश इसलिए प्राप्त हुआ क्योंकि आपने Google समूह "Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)" समूह की सदस्यता ली है.
इस समूह में पोस्ट करने के लिए, technic...@googlegroups.com को ईमेल भेजें.
इस समूह से सदस्यता समाप्त करने के लिए, technical-hin...@googlegroups.com को ईमेल करें.
और विकल्पों के लिए, http://groups.google.com/group/technical-hindi?hl=hi पर इस समूह पर जाएं.



--
Shrish Benjwal Sharma (श्रीश बेंजवाल शर्मा)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
If u can't beat them, join them.

ePandit: http://epandit.shrish.in/

ePandit | ई-पण्डित

unread,
Apr 14, 2011, 12:34:09 PM4/14/11
to technic...@googlegroups.com
एक बात और यह ध्यान दिया जाना चाहिये कि हिन्दी में प्रयुक्त होने वाले विराम चिह्नों (जैसे ? . %) तथा गणितीय चिह्नों जैसे गुणा, भाग आदि का चिह्न की जगह कोई अन्य वर्ण न रखा जाय क्योंकि परिवर्तक बनाने में इनकी जगह कुछ और रखा होने से बहुत समस्या आती है। जैसे चाणक्य में " की जगह स्वस्तिक चिह्न है, इससे यूनिकोड को चाणक्य में बदलते वक्त सभी कोट्स स्वस्तिक में बदल जाते हैं, मुझे ऐसा करने से रोकने हेतु कई रेगुलर ऍक्सप्रैशन प्रयोग करने पड़े तब भी गलती की सम्भावना रहती है। साथ ही चाणक्य में लिगेसी गुणा चिह्न के लिये तो ऑस्की "&" का प्रयोग हुआ है जबकि लिगेसी "म" के लिये ऑस्की गुणा चिह्न का प्रयोग हुआ है जिससे परिवर्तक में सही बदलने का काम बहुत जटिल हो जाता है। अगर चाणक्य का निर्माता गुणा की जगह गुणा ही रहने देता तथा "&" की जगह "म" रखता तो ये समस्या न आती।

इसलिये कॉमन विराम चिह्नों (जो देवनागरी में भी प्रयुक्त होते हैं) को यथावत रखा जाय तथा उनकी जगह कोई और वर्ण न रखे जायें।

१४ अप्रैल २०११ ९:५६ अपराह्न को, ePandit | ई-पण्डित <sharma...@gmail.com> ने लिखा:

narayan prasad

unread,
Apr 14, 2011, 1:34:36 PM4/14/11
to technic...@googlegroups.com
<<एक बात और यह ध्यान दिया जाना चाहिये कि हिन्दी में प्रयुक्त होने वाले विराम चिह्नों (जैसे ? . %) तथा गणितीय चिह्नों जैसे गुणा, भाग आदि का चिह्न की जगह कोई अन्य वर्ण न रखा जाय क्योंकि परिवर्तक बनाने में इनकी जगह कुछ और रखा होने से बहुत समस्या आती है। >>

इसकी चर्चा मेरे पूर्व सन्देश में की गई है ।
"कूट बिन्दु 33-64, 91-96, 182  (कुल उनचालीस) का प्रयोग भारतीय लिपियों में भी किया जाता है ।"

विराम चिह्न इन्हीं कूट बिन्दुओं के अन्तर्गत आते हैं ।

ePandit | ई-पण्डित

unread,
Apr 14, 2011, 1:55:25 PM4/14/11
to technic...@googlegroups.com
हाँ जी अभी ध्यान दिया। इन कूट बिन्दुओं को छोड़ा जाना बहुत जरुरी है।

2011/4/14 narayan prasad <hin...@gmail.com>
--
आपको यह संदेश इसलिए प्राप्त हुआ क्योंकि आपने Google समूह "Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)" समूह की सदस्यता ली है.
इस समूह में पोस्ट करने के लिए, technic...@googlegroups.com को ईमेल भेजें.
इस समूह से सदस्यता समाप्त करने के लिए, technical-hin...@googlegroups.com को ईमेल करें.
और विकल्पों के लिए, http://groups.google.com/group/technical-hindi?hl=hi पर इस समूह पर जाएं.

ePandit | ई-पण्डित

unread,
Apr 14, 2011, 2:07:17 PM4/14/11
to technic...@googlegroups.com
एक बात और मेरे दिमाग में है। 8 बिट में यूनिकोड की तरह सभी भारतीय भाषाओं के चिह्न तो आ नहीं सकते। एक ही भाषा के भी आ जायें बहुत है, तो इसलिये कूट निर्धारण का काम ऐसे होना चाहिये कि भारतीय भाषाओं के साझे वर्ण-चिह्नों का कूट समान हो। यानि जिस कूट बिन्दु पर हिन्दी का "अ" हो वहीं पंजाबी का "ਅ", गुजराती का "અ" तथा बंगाली का " অ". इस तरह के मानक होने से एक भाषा-लिपि में लिखे पाठ को केवल फॉण्ट सलैक्शन बॉक्स से फॉण्ट चुनकर बदलने से वह स्वतः ही दूसरी लिपि में बदल जायेगा (शायद केवल कुछ चिह्न छोड़कर जिनकी आगे बात कर रहा हूँ)। अगर हम ऐसे कोड सैट तैयार कर पायें तो यह इसकी एक बड़ी विशेषता होगी तथा विभिन्न फॉण्ट निर्माताओं को इसे अपनाने के लिये यह एक आकर्षण होगा। जैसे भारतीय भाषायी मानक इन्स्क्रिप्ट कीबोर्ड की यह एक बड़ी विशेषता होती है कि एक ही लेआउट से सारी भारतीय भाषायें टाइप हो जाती हैं।

यानि सभी भाषा लिपियों के साझे मूल वर्ण तथा साझे संयुक्ताक्षर तो समान कूट बिन्दुओं पर रखे जायें तथा भिन्न संयुक्ताक्षरो/चिह्नों को अलग से एक तरफ (प्राइवेट एरिया टाइप में) रखा जाय। इसके अलावा सभी चिह्नों को जहाँ तक हो सके किसी क्रम से कूट-बिन्दु दिये जायें।

ऐसी सम्भावना बारे आपका क्या विचार है?

१४ अप्रैल २०११ ११:२५ अपराह्न को, ePandit | ई-पण्डित <sharma...@gmail.com> ने लिखा:

narayan prasad

unread,
Apr 14, 2011, 9:32:41 PM4/14/11
to technic...@googlegroups.com
<<कूट निर्धारण का काम ऐसे होना चाहिये कि भारतीय भाषाओं के साझे वर्ण-चिह्नों का कूट समान हो। >>

इस बात को मैं अपने पूर्व सन्देश में बता चुका हूँ । निम्नलिखित अंश पर ध्यान दें -

"अब इन उपलब्ध 156 कूट बिन्दुओं में ही सभी देवनगरी वर्णों और वर्णखंडों को रखना है । इनमें से 128 का प्रयोग यूनिकोड में प्रदत्त क्रम को ही रखा जाय तो आगे भी आसानी रहेगी ।"

<<यानि सभी भाषा लिपियों के साझे मूल वर्ण तथा साझे संयुक्ताक्षर तो समान कूट बिन्दुओं पर रखे जायें तथा भिन्न संयुक्ताक्षरो/चिह्नों को अलग से एक तरफ (प्राइवेट एरिया टाइप में) रखा जाय। इसके अलावा सभी चिह्नों को जहाँ तक हो सके किसी क्रम से कूट-बिन्दु दिये जायें।>>

पूरी तरह सहमत ।


<<ऐसी सम्भावना बारे आपका क्या विचार है?>>

"बारे" शब्द के हिन्दी में आपके इस प्रकार के प्रयोग पर प्रतीत होता है कि आपकी मातृभाषा का प्रभाव है । मेरी मातृभाषा मगही में भी इसी प्रकार प्रयोग में है । परन्तु मानक हिन्दी में "के बारे में" का प्रयोग होता है ।


---नारायण प्रसाद

2011/4/14 ePandit | ई-पण्डित <sharma...@gmail.com>

Ravishankar Shrivastava

unread,
Apr 15, 2011, 12:10:48 AM4/15/11
to Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)
मेरा मानना है कि हम 8 बिट फॉन्ट मानकीकरण के बारे में बातें कर समय व
रिसोर्स जाया कर रहे हैं. ये तो कंप्यूटिंग दुनिया में पीछे लौटने जैसा
है. आज जब हर किस्म के कंप्यूटर उपकरण और यहाँ तक कि मोबाइल उपकरण भी
यूनिकोड हिंदी समर्थन प्रदान करने लगे हैं, पुराने 8 बिट फॉन्ट में लौटना
किसी भी सूरत में संभव नहीं है.
और, ज्यादा नहीं, आने वाले 5 वर्षों में सभी हार्डवेयर साफ़्टवेयर
यूनिकोड समर्थित हो जाएंगे, तब न तो 8 बिट की जरूरत होगी और न ही उनके
प्रयोक्ता अधिक संख्या में बचेंगे. नई टेक्नोलॉजी की सुविधाओं का प्रयोग
हम सभी को करना चाहिए, भले ही शुरूआत में अड़चनें आएँ.
मेरा फिर से अनुरोध है कि यह संभव ही नहीं है नए सिरे से 8 बिट हिंदी
फ़ॉन्ट का मानकीकरण किया जाए. बाजार में कोई लेवाल ही नहीं रहेगा.
यूनिकोड के साथ आगे बढ़ो दोस्तों, इसी में भविष्य है.

सादर,
रवि

On Apr 14, 10:58 am, narayan prasad <hin...@gmail.com> wrote:
> अभी तक इस विषय पर विशेष चर्चा नहीं हुई । एक ही विषय पर एक से अधिक चर्चा समूह
> और अलग-अलग शीर्षक हो जाने से मामला पेचीदा होता जा रहा है । इसलिए इसे
> तकनीकी-हिन्दी समूह पर ही इस विषय पर अपने विचार रख रहा हूँ ।
>
> (1) पुराने फोंट के परिवर्तक बनाते समय मुझे सबसे ज्यादा दिक्कत उन कूट
> बिन्दुओं पर रखे गए देवनागरी वर्ण/ वर्णखंडों के परिवर्तन में हुई जिनका प्रयोग
> तकनीकी रूप से अनुपयुक्त या अवैध है, क्योंकि ऐसे कूट बिन्दु कुछ विशेष कार्य
> के लिए रिज़र्व रखे गए हैं । ये कूट बिन्दु हैं -
>   127, 128-129, 141-144, 157-158
>
> Ulrich Stiehl ने itranslator99 के प्रयोग के लिए जो itmanual.pdf तैयार किया
> है उसमें Sanskrit99 फोंट के बारे में निम्नलिखित टिप्पणी की है -
>
>  The codes 127, 128-129, 141-144, 157-158 (not used in original TTF and PS
> fonts) have been left empty, because characters in these slots are often
> skipped by printer drivers.
>
> विस्तृत चर्चा के लिए देखें -
> Font Converters vs Codes 127, 128-129, 141-144, 157-158

> <http://groups.google.com/group/technical-hindi/msg/06154e54364530e4>

Anuradha R.

unread,
Apr 15, 2011, 2:50:17 AM4/15/11
to technic...@googlegroups.com, Ravishankar Shrivastava
रविजी की बातों से सहमत हूं। अब आगे देखना ही बेहतर होगा। धीरे-धीरे सभी नई तकनीक अपना रहे हैं। और, जो भी नए लोग कंप्यूटर तकनीक का इस्तेमाल कर रहे हैं, वे अनायास भी नई तकनीक ही पाएंगे। इसलिए आगे गेखें साथियो।
-अनुराधा

2011/4/15 Ravishankar Shrivastava <ravir...@gmail.com>
--
आपको यह संदेश इसलिए प्राप्त हुआ क्योंकि आपने Google समूह "Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)" समूह की सदस्यता ली है.
इस समूह में पोस्ट करने के लिए, technic...@googlegroups.com को ईमेल भेजें.
इस समूह से सदस्यता समाप्त करने के लिए, technical-hin...@googlegroups.com को ईमेल करें.
और विकल्पों के लिए, http://groups.google.com/group/technical-hindi?hl=hi पर इस समूह पर जाएं.




--
LIFE IS BEAUTIFUL.....Live it to the fullest!!!!

Hariraam

unread,
Apr 16, 2011, 9:39:54 AM4/16/11
to technic...@googlegroups.com
रवि जी,
 
आपका कहना सही है।
 
इस चर्चा का मूल विषय था - Font-code-standardisation
बाद में किसी ने बदलकर 8-बिट फोंट-कोड का मानकीकरण कर दिया।
 
युनकोडित 16 बिट ओपेन टाइप फोंट्स में भी बहुत प्रकार की विभिन्नताएँ व समस्याएँ हैं। किसी फोंट में कोई वर्ण कैसा प्रकट होता है तो दूसरे फोंट में अलग प्रकार से। संयुक्ताक्षरों के कूट निर्धारित नहीं हैं, sorting order व indexing में कई प्रकार की त्रुटियाँ हैं।
 
केवल 16-बिट ओपेन टाइप फोंट कम्प्यूटर में इन्स्टाल हों और युनिकोड सक्रिय हो, इससे भी काम नहीं चलता, OS के rendering इंजन पर पूरी तरह निर्भर रहना पड़ता है।
 
यदि कुछ वर्ष पहले (सन् 2002 में) ही INSFOC का मानकीकरण हो गया होता तो आज इतनी परेशानियाँ न आती। ड्राफ्ट कोड जारी किए गए थे, सभी कृपया इनका अवलोकन करें--
 
इसे पीछे लौटना नहीं कहेंगे, आपके अनुसार ही आगामी 5 वर्षों तक के समय को 8-बिट और 16-बिट का संक्रान्ति काल कहेंगे, जो तकनीकी खामियाँ भारतीय लिपियों के वर्णों में हैं, उनका सही कारण यूजर समझें तो भविष्य में आनेवाली पीढ़ियों को परेशानियों से बचाया जा सकेगा।
 
जबतक Open Source में और निःशुल्क, कोई अच्छा DTP/Designing सॉफ्टवेयर, Offset printing tools, जो Indic युनिकोड समर्थित हो, भारतीय जनता को, छोटे-मोटे प्रेसवालों को, उपलब्ध नहीं हो जाता, 8-बिट फोंट्स का प्रयोग होता रहेगा।
 
फोंट-कोड के मानक निर्धारित कर जारी कर देने में, मेरे विचार में, लागत कुछ नहीं है। न ही ज्यादा कोई परेशानी है।
 
आपने कहा -- "बाजार में कोई लेवाल ही नहीं रहेगा।" इसका अर्थ शायद आर्थिक सन्दर्भ में नहीं होगा। मानक न तो कहीं बेचे जाते हैं, न ही कोई खरीदता है। हाँ, कुछ लोग मानकों का अनुकरण करते हैं, कुछ लोग नहीं।
 
सोचिए, यदि आज युनिकोड मानक ही नहीं होते, तो क्या हम इस प्रकार ई-चर्चा कर पाते? अन्तर्राष्ट्रीय मंच पर अग्रणी बने रहने के लिए हर कहीं मानक आवश्यक होते हैं।
 
आप ही के अनुसार, मानक निर्धारित न हों तो आपके कहे अनुसार आगामी 5 वर्षों तक आम जनता को परेशानियाँ झेलनी पड़ेगीं और करोड़ों रुपये के राष्ट्रीय Man-hour और बर्बाद होंगे। जितने बर्बाद हो गए, उन्हें तो हम वापस लौटा नहीं सकते, लेकिन भविष्य में चाहें तो बचाए जा सकते हैं।
 
यदि आपके जैसे बुद्धिजीवी भी ऐसे ही सोचें कि 5 वर्षों तक लोगों को परेशानियाँ झेलने दो, तो जनता को परेशानियों से कौन बचाएगा?
 
सादर।
 
-- हरिराम
 
 


 
2011/4/15 Ravishankar Shrivastava <ravir...@gmail.com>
मेरा मानना है कि ...आज जब हर किस्म के कंप्यूटर उपकरण और यहाँ तक कि मोबाइल उपकरण भी

Hariraam

unread,
Apr 16, 2011, 10:26:52 AM4/16/11
to technic...@googlegroups.com, indi...@googlegroups.com
कार्य शुरू करने के लिए आवश्यक है --
1. अधिकांशतः प्रचलित 8-बिट देवनागरी फोंट्स की (समान कोड-प्वाइंट वाले फोंट्स में से सिर्फ एक फोंट) कीएक एक प्रति किसी एक मुक्त सर्वर स्थान पर भण्डारित की जाए। (ध्यान रहे कि जो फोंट कॉपीराइट हों, उनके घोषित नियमों का अनुपालन जाए।)
2. अभी तक निर्मित फोंट-कोड-कनवर्टरों के तुलनात्मक मैप के चार्ट भी वहाँ संग्रहीत किए जाएँ।
3. विकल्प रिप्लेशमेंट, रेगुलर एक्सप्रेशन्स आदि के लॉजिक की व्याख्या संग्रहीत की जाए।
4. सी-डैक तथा TDIL द्वारा जारी किए फोंट कोड मानकीकरण के ड्राफ्ट (http://tdil.mit.gov.in/INSFOC.PDF) भी वहाँ रखा जाए।
5. एक समेकित ड्राफ्ट कोड-चार्ट बनाकर वहाँ रखा जाए।
6. सभी इस पर अपने फीडबैक दें और तदनुसार ड्राफ्ट कोड-चार्ट में परिवर्तन किया जाए।

कृपया कोई मुक्त सर्वर स्पेश सुनिश्चित करने हेतु सुझाव दें।

-- हरिराम



On 15-04-2011 07:02, narayan prasad wrote:
<<कूट निर्धारण का काम ऐसे होना चाहिये कि भारतीय भाषाओं के साझे वर्ण-चिह्नों का कूट समान हो। >>

इस बात को मैं अपने पूर्व सन्देश में बता चुका हूँ । निम्नलिखित अंश पर ध्यान दें -
"अब इन उपलब्ध 156 कूट बिन्दुओं में ही सभी देवनगरी वर्णों और वर्णखंडों को रखना है । इनमें से 128 का प्रयोग यूनिकोड में प्रदत्त क्रम को ही रखा जाय तो आगे भी आसानी रहेगी ।"

<<यानि सभी भाषा लिपियों के साझे मूल वर्ण तथा साझे संयुक्ताक्षर तो समान कूट बिन्दुओं पर रखे जायें तथा भिन्न संयुक्ताक्षरो/चिह्नों को अलग से एक तरफ (प्राइवेट एरिया टाइप में) रखा जाय। इसके अलावा सभी चिह्नों को जहाँ तक हो सके किसी क्रम से कूट-बिन्दु दिये जायें।>>

पूरी तरह सहमत ।

---नारायण प्रसाद

2011/4/14 ePandit | ई-पण्डित <sharma...@gmail.com>
एक बात और मेरे दिमाग में है। 8 बिट में यूनिकोड की तरह सभी भारतीय भाषाओं के चिह्न तो आ नहीं सकते। एक ही भाषा के भी आ जायें बहुत है, तो इसलिये कूट निर्धारण का काम ऐसे होना चाहिये कि भारतीय भाषाओं के साझे वर्ण-चिह्नों का कूट समान हो।.............भिन्न संयुक्ताक्षरो/चिह्नों को अलग से एक तरफ (प्राइवेट एरिया टाइप में) रखा जाय। इसके अलावा सभी चिह्नों को जहाँ तक हो सके किसी क्रम से कूट-बिन्दु दिये जायें।



Vinod Sharma

unread,
Apr 16, 2011, 11:18:34 AM4/16/11
to technic...@googlegroups.com
हरिरामजी, क्या निम्नलिखित लिंक किसी काम के हैं?            
 
2011/4/16 Hariraam <hari...@gmail.com>

--
आपको यह संदेश इसलिए प्राप्त हुआ क्योंकि आपने Google समूह "Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)" समूह की सदस्यता ली है.
इस समूह में पोस्ट करने के लिए, technic...@googlegroups.com को ईमेल भेजें.
इस समूह से सदस्यता समाप्त करने के लिए, technical-hin...@googlegroups.com को ईमेल करें.
और विकल्पों के लिए, http://groups.google.com/group/technical-hindi?hl=hi पर इस समूह पर जाएं.



--
Vinod Sharma
gtalk: vinodjisharma
skype:vinodjisharma
Services Provided:
Translation, Proofreading, Editing, Reviewing, Transcripting, Voice-Over.

Vinod Sharma

unread,
Apr 16, 2011, 11:33:12 AM4/16/11
to technic...@googlegroups.com
यह भी देखें
2011/4/16 Vinod Sharma <vinodj...@gmail.com>

narayan prasad

unread,
Apr 16, 2011, 11:48:31 AM4/16/11
to Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)
हरिराम जी,
     आप क्या कह रहे हैं, मेरी तो कुछ भी समझ में नहीं आ रहा । प्रतीत होता है कि श्रीश जी ने और मैंने इस विषय पर जो कुछ कहा उसे आपने बिलकुल नहीं पढ़ा । जब मानकीकरण की बात कर रहे हैं तो सभी पुराने फोंट के संग्रह की क्या आवश्यकता है ? आपकी दी गई कड़ी में INSFOC.pdf में भी केवल monlingual देवनागरी की बात की गई है जबकि हमलोगों ने bilingual को ही रखने का प्रस्ताव रखा है, क्योंकि monolingual में सभी विरामचिह्नों के स्थान पर भी देवनागरी चिह्न रख दिए जाएँगे जो हमें बिलकुल पसन्द नहीं ।
--- नारायण प्रसाद

2011/4/16 Hariraam <hari...@gmail.com>

Hariraam

unread,
Apr 17, 2011, 3:11:39 PM4/17/11
to technic...@googlegroups.com
नारायण जी,


On 16-04-2011 21:18, narayan prasad wrote:
हरिराम जी,
     ........... जब मानकीकरण की बात कर रहे हैं तो सभी पुराने फोंट के संग्रह की क्या आवश्यकता है ?
तुलनात्मक विवरण हेतु, तथा शायद मानक फोंट से विविध फोंट में कनवर्शन की टेस्टिंग हेतु


आपकी दी गई कड़ी में INSFOC.pdf में भी केवल monlingual देवनागरी की बात की गई है जबकि हमलोगों ने bilingual को ही रखने का प्रस्ताव रखा है, क्योंकि monolingual में सभी विरामचिह्नों के स्थान पर भी देवनागरी चिह्न रख दिए जाएँगे जो हमें बिलकुल पसन्द नहीं ।
Bilingual Draft font-code का चार्ट बना रहा हूँ, DVBW-TTYogesh के आधार पर।
विराम चिह्नों को ज्यों का त्यों रखते हुए भी Monolingual font हो सकते हैं।

-- हरिराम

ePandit | ई-पण्डित

unread,
Apr 18, 2011, 4:52:46 AM4/18/11
to technic...@googlegroups.com
युनकोडित 16 बिट ओपेन टाइप फोंट्स में भी बहुत प्रकार की विभिन्नताएँ व समस्याएँ हैं। किसी फोंट में कोई वर्ण कैसा प्रकट होता है तो दूसरे फोंट में अलग प्रकार से। संयुक्ताक्षरों के कूट निर्धारित नहीं हैं, sorting order व indexing में कई प्रकार की त्रुटियाँ हैं

हरिराम जी पहले तो ये बतायें कि आप 8 बिट फॉण्ट कोड के मानकीकरण की योजना बना रहे हैं या 16 बिट या फिर दोनों के।

दूसरी बात यदि16 बिट की योजना बना रहे हैं तो ये बतायें कि क्या यह यूनिकोड पर आधारित होगा या बिलकुल अलग? यदि यूनिकोड पर आधारित होगा तो नया क्या किया जायेगा?

यदि 16 बिट की बात कर रहे हैं तो क्या 8 बिट की अब जरुरत है जबकि सभी प्रोग्राम 16 बिट हैण्डल कर सकते हैं?

2011/4/16 Hariraam <hari...@gmail.com>

--
आपको यह संदेश इसलिए प्राप्त हुआ क्योंकि आपने Google समूह "Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)" समूह की सदस्यता ली है.
इस समूह में पोस्ट करने के लिए, technic...@googlegroups.com को ईमेल भेजें.
इस समूह से सदस्यता समाप्त करने के लिए, technical-hin...@googlegroups.com को ईमेल करें.
और विकल्पों के लिए, http://groups.google.com/group/technical-hindi?hl=hi पर इस समूह पर जाएं.



--

ePandit | ई-पण्डित

unread,
Apr 18, 2011, 4:56:47 AM4/18/11
to technic...@googlegroups.com
Bilingual Draft font-code का चार्ट बना रहा हूँ, DVBW-TTYogesh के आधार पर। विराम चिह्नों को ज्यों का त्यों रखते हुए भी Monolingual font हो सकते हैं।

बाइलिंग्वल से आपका आशय केवल विराम चिह्नों से है या रोमन वर्ण भी शामिल करने से है?

दूसरी बात क्या बाइलिंग्वल 8 बिट में भी सम्भव है? मेरे ख्याल से तो नहीं क्योंकि 26 स्थान तो रोमन वर्ण ही घेर लेंगे।

2011/4/18 Hariraam <hari...@gmail.com>

--
आपको यह संदेश इसलिए प्राप्त हुआ क्योंकि आपने Google समूह "Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)" समूह की सदस्यता ली है.
इस समूह में पोस्ट करने के लिए, technic...@googlegroups.com को ईमेल भेजें.
इस समूह से सदस्यता समाप्त करने के लिए, technical-hin...@googlegroups.com को ईमेल करें.
और विकल्पों के लिए, http://groups.google.com/group/technical-hindi?hl=hi पर इस समूह पर जाएं.

ePandit | ई-पण्डित

unread,
Apr 18, 2011, 5:07:46 AM4/18/11
to indi...@googlegroups.com, technic...@googlegroups.com
अधिकांशतः प्रचलित 8-बिट देवनागरी फोंट्स की (समान कोड-प्वाइंट वाले फोंट्स में से सिर्फ एक फोंट) कीएक एक प्रति किसी एक मुक्त सर्वर स्थान पर भण्डारित की जाए।

आपकी आवश्यकता के अनुसार गूगल साइट बिलकुल सही जगह है। यहाँ एक साइट बना दी है तथा कृतिदेव के दो मुफ्त संस्करण KrutiDev 010 तथा KrutiDev 011 अपलोड कर दिये हैं। कृपया अन्य मुफ्त संस्करण बतायें जिन्हें वहाँ डाला जा सके।


अभी तक निर्मित फोंट-कोड-कनवर्टरों के तुलनात्मक मैप के चार्ट भी वहाँ संग्रहीत किए जाएँ।

तुलनात्मक मैप से मैं आपका आशय नहीं समझा।

विकल्प रिप्लेशमेंट, रेगुलर एक्सप्रेशन्स आदि के लॉजिक की व्याख्या संग्रहीत की जाए।

जरा यह भी समझायें कि इससे आपका क्या मतलब है, क्या आप चाहते हैं कि विभिन्न प्रोग्रामिंग भाषाओं में रेगुल ऍक्सप्रैशन का सिण्टैक्स बताया जाय?

सी-डैक तथा TDIL द्वारा जारी किए फोंट कोड मानकीकरण के ड्राफ्ट भी वहाँ रखा जाए।

रख दिया, कोई और ऐसा दस्तावेज रखना हो तो बतायें।

एक समेकित ड्राफ्ट कोड-चार्ट बनाकर वहाँ रखा जाए।

इस पर आप कार्य शुरु करें बाद में बाकी लोग राय देंगे।


2011/4/16 Hariraam <hari...@gmail.com>

--
You received this message because you are subscribed to the Google Groups "Indicoms" group.
To post to this group, send email to indi...@googlegroups.com
To unsubscribe from this group, send email to indicoms-u...@googlegroups.com
For more options, visit this group at http://groups.google.com/group/indicoms?hl=en
------
Discussion group for Standardisation needs for Computing in Indian Languages/scripts.

narayan prasad

unread,
Apr 18, 2011, 7:22:14 AM4/18/11
to technic...@googlegroups.com
<<दूसरी बात क्या बाइलिंग्वल 8 बिट में भी सम्भव है? मेरे ख्याल से तो नहीं क्योंकि 26 स्थान तो रोमन वर्ण ही घेर लेंगे।>>

रोमन अक्षर 26 ही नहीं जी, बल्कि 52 स्थान घेर लेंगे।
---नारायण प्रसाद
2011/4/18 ePandit | ई-पण्डित <sharma...@gmail.com>

Hariraam

unread,
Apr 18, 2011, 10:18:04 AM4/18/11
to technic...@googlegroups.com, indi...@googlegroups.com
यदि NGO मानक संस्थान बने, तो कई प्रकार के मानकों के कार्य करने पड़ेंगे।

 
2011/4/18 ePandit | ई-पण्डित sharma...@gmail.com
हरिराम जी पहले तो ये बतायें कि आप 8 बिट फॉण्ट कोड के मानकीकरण की योजना बना रहे हैं या 16 बिट या फिर दोनों के।
 
 
प्रथम चरण में 8 बिट
 
द्विताय चरण में 16 बिट
 
दूसरी बात यदि16 बिट की योजना बना रहे हैं तो ये बतायें कि क्या यह यूनिकोड पर आधारित होगा या बिलकुल अलग? यदि यूनिकोड पर आधारित होगा तो नया क्या किया जायेगा?
 
युनिकोड से अलग फिलहाल कोई कल्पना करना भी उचित नहीं।
 
प्राथमिकता दी जा रही है ऐसे 16 बिट युनिकोडित ओपेन टाइप देवनागरी फोंट के विकास हेतु, जो बिना OS के rending engine का सहारा लिए भी पूरा सही आउटपुट दे सके। Graphics, DTP, Designing, साफ्टवेयरों व image-setter. offset printing के उपकरणों हेतु भी उपयुक्त हो सके। 
 
TDIL, MIT द्वारा सकल-भारती नामक OT font विकसित हो रहा है, जो सभी भारतीय लिपियों के लिए एक-समान width, height, thickness, linespacing इत्यादि गुणों से युक्त होगा।
 
यदि 16 बिट की बात कर रहे हैं तो क्या 8 बिट की अब जरुरत है जबकि सभी प्रोग्राम 16 बिट हैण्डल कर सकते हैं?
 
क्योंकि पुराने सॉफ्टवेयर, यथा पेजमेकर आदि  16 बिट (युनिकोड) के लिए समर्थ नहीं हो सकते, कदापि। उनके लिए 8 बिट ही एकमात्र आसरा है। और इनका उपयोग मुद्रण उद्योग में लगभग 5 वर्षों तक होता रहेगा।
 
सफल प्रोग्राम या OS वही माना जाता है, जिसमें Backward Compatibility हो। किन्तु Windows 7 के 64 बिट वाले वर्सन में पुराने 16 बिट वाले कोई प्रोग्राम नहीं चल सकते। Backward Compatibilty नहीं है। इसके विपरीत Linux के किसी भी flavour में 7 बिट से लेकर 64 बिट तक के सारे प्रोग्राम चल पाते हैं।
 
-- हरिराम

Hariraam

unread,
Apr 18, 2011, 10:26:01 AM4/18/11
to technic...@googlegroups.com
CDAC के DVBW-TTYogesh फोंट को देखें। पहले 128 ASCII code ज्यों के त्यों रखे गए हैं। कुछ OS की कमांड के लिए रिजर्व होते हैं। शेष 70-75 स्थानों में देवनागरी (तथा अन्य लिपियों को उनके फोंट्स में) compact कर adjust किया गया है।
 
मुद्रण उद्योग के लिए Monolingual फोंट बेहतर होते हैं।
Data Processing कार्यों, डैटाबेस आदि के लिए Bilingual font बेहतर होते हैं।
-- हरिराम
2011/4/18 ePandit | ई-पण्डित <sharma...@gmail.com>

ePandit | ई-पण्डित

unread,
Apr 18, 2011, 9:06:50 PM4/18/11
to technic...@googlegroups.com
मुद्रण उद्योग के लिए Monolingual फोंट बेहतर होते हैं।
Data Processing कार्यों, डैटाबेस आदि के लिए Bilingual font बेहतर होते हैं।

हाँ पर मोनोलिंग्वल में भी विराम चिह्नों तथा गणितीय चिह्नों के कूट बिन्दु स्थान समान रखने चाहिये नहीं तो कन्वर्टरों तथा कीबोर्ड ड्राइवरों में भारी समस्या आती है।

2011/4/18 Hariraam <hari...@gmail.com>
--
आपको यह संदेश इसलिए प्राप्त हुआ क्योंकि आपने Google समूह "Scientific and Technical Hindi (वैज्ञानिक तथा तकनीकी हिन्दी)" समूह की सदस्यता ली है.
इस समूह में पोस्ट करने के लिए, technic...@googlegroups.com को ईमेल भेजें.
इस समूह से सदस्यता समाप्त करने के लिए, technical-hin...@googlegroups.com को ईमेल करें.
और विकल्पों के लिए, http://groups.google.com/group/technical-hindi?hl=hi पर इस समूह पर जाएं.
Reply all
Reply to author
Forward
0 new messages