हिन्दी वर्तनी शोधक व शब्दकोश निर्माण

336 views
Skip to first unread message

Hariram Pansari

unread,
Nov 10, 2006, 7:12:51 AM11/10/06
to hi...@googlegroups.com
हिन्दी वर्तनी शोधक एवं शब्दकोश निर्माण की समस्याएँ
 
हिन्दी वर्तनी शोधक एवं शब्दकोश आदि पहले 8-बिट वाले ASCII कूटों पर पैबन्द की तरह चिपके हिन्दी के अक्षरों के आधार पर होता था। सी-डैक तथा विभिन्न भारतीय भाषी सॉफ्टवेयरों में ये उसी आधार पर कार्य करते थे, जो काफी सरल होता था। लेकिन यूनिकोड 16 बिट कूटों में इनको संसाधित करने में कई तरह की जटिल समस्याएँ पैदा हो रही हैं, जैसे--
 
हिन्दी देवनागरी के अक्षर केवल मूल मानकीकृत कूट में संसाधित व प्रदर्शित नहीं हो पाते। उन्हें जटिल टीएसआर प्रोग्राम के तहत उड़ते-उड़ते ताण्डव नृत्य करना पड़ता है। संसाधन के लिए एक प्रकार के कूट और दिखाने व छापने के लिए दूसरे प्रकार के कूट, जो ओपेन टाइप फोंट्स के जटिल ग्लीफ (अक्षरों के टुकड़े या मात्रा या कई अक्षर मिलकर बने संयुक्ताक्षरों) रूपान्तरण अलगोरिद्‍म के आधार पर ट्विस्ट करते रहते हैं। जैसे हाथी के दाँत खाने के और तथा दिखाने के और।
 
देवनागरी वर्णक्रम-निर्धारण का मानकीकरण आज तक नहीं हो पाया है। जो शब्दकोशों के निर्माण का ठोस आधार है।

देवनागरी की मानकीकृत वर्तनी का कम्प्यूटर के सन्दर्भ में संशोधन नितान्त आवश्यक है।
 
देवनागरी के लिए भी अंग्रेजी के कोरियर फोंट के समरूप निर्धारित चौड़ाई वाले (फिक्स विड्थ) अक्षरों/फोंट्स की नितान्त आवश्यकता है, जो शब्द के मूलाक्षर की गिनती करने और तदनुरूप हर खाने में अक्षर के आधार पर डैटाबेस फोर्मेट के फील्ड साइज को निर्धारित व प्रदर्शित कर सके।
 
अधिकांशतः हिन्दी देवनागरी के विद्वान आपस में बेकार चर्चा अधिक करते हैं व तकनीकी काम व समाधान कम। आवश्यकता है कि वे इन समस्याओं को समझें और उन्हें दूर करने के लिए अपना तकनीकी ज्ञान बढ़ायें और एक जुट होकर कार्य करें।
 
फिलहाल जो डेवलपर देवनागरी हिन्दी के लिए कार्य कर रहे हैं, निःशुल्क अमूल्य तकनीकी सेवा प्रदान कर रहे हैं, उनका हिन्दी ज्ञान नगण्य है। उनकी सुविधा के लिए अंग्रेजी में लिखना जरूरी हो जाता है।
 
अंग्रेजों ने हिन्दुस्तान पर शासन करने के पहले स्वयं हिन्दी सीखी थी, टूटी-फूटी हिन्दी में बोलकर ही वे यहाँ पर अंग्रेजी का साम्राज्य लाद सके थे, जो आज तक नहीं मिट पाया है। इसी प्रकार हमें भी हिन्दी का साम्राज्य फैलाना है तो अंग्रेजी का यथा-आवश्यक सहारा लेने में कभी शर्म, हिचकिचाहट या थोथा-घमण्ड आड़े नहीं आने देना चाहिए।
 
देवनागरी का जो कूट-निर्धारण यूनिकोड इंक ने किया है, वह इस्की-1988 पर आधारित है, उसमें मूलभूत त्रुटियाँ रह गईं हैं, जिससे संसार की सबसे सरल एवं सबसे सुसंस्कृत लिपि "जटिल" बन गई है। यूनिकोड की "स्टेबिलिटी पॉलिसी" किसी परिवर्तन की इजाजत नहीं देती, चाहे वह सम्पूर्णतः गलत ही क्यों न हो। न तो वे भारत सरकार की सिफारिश पर सकारात्मक सुनावाई करते हैं और न ही भारत के तकनीकी विद्वानों की उचित मांग पर। अन्ततः शायद अमेरिकी वीटो पावर के आगे सबको नतमस्तक होना पड़ता है।
 
अतः फिलहाल विभिन्न तकनीकी संस्थानों (आई.आई.टी.) द्वारा हिन्दी-देवनागरी व अन्य भारतीय भाषाओं में जो भी "प्राकृतिक भाषा संसाधन" (NLP) के विकास कार्य जारी हैं, वे एक अति सरल 7-बिट कूट में संसाधित व विकसित किए जाते हैं और फिर भूमण्डलीय समतुल्यता के लिए यूनिकोड में बदले जाते हैं। अतः आवश्यकता है कि देवनागरी के मौलिक स्वरूप के अनुरूप एक सरल अक्षर-कूट का निर्धारण किया जाए एवं सबसे पहले उपयोगकर्ताओं का एक समूह बनाकर "प्राईवेट" स्तर पर इसे "मानकीकृत" का ठप्पा लगाया जाए। फिर राष्ट्रीय स्तर पर एवं ततपश्चात् अन्तर्राष्ट्रीय स्तर पर मानकीकरण/स्वीकृति के लिए संघर्ष किया जाए।
 
देवनागरी-हिन्दी में कुछ तर्कहीन और अवैज्ञानिक पारम्परिक प्रचलन हैं, जो भाषा व लिपि को अति क्लिष्ट बनाते हैं, इनको सरलीकरण करके मानकीकरण करना भी नितान्त आवश्यक है।
 
हरिराम
 
On 11/10/06, hindi वर्ग <nor...@googlegroups.com> wrote:

द्वारा: "kalanath mishra"


आप सभी रोमन हिन्दी की बात कर रहे हैं क्या? यदि नहीं तो देवनागरी मे क्यों नही
बात करते. अब तो लिखना बहुत कठिन नही है.
Reply all
Reply to author
Forward
0 new messages