हिन्दी वर्तनी शोधक एवं शब्दकोश निर्माण की समस्याएँ
हिन्दी वर्तनी शोधक एवं शब्दकोश आदि पहले 8-बिट वाले ASCII कूटों पर पैबन्द की तरह चिपके हिन्दी के अक्षरों के आधार पर होता था। सी-डैक तथा विभिन्न भारतीय भाषी सॉफ्टवेयरों में ये उसी आधार पर कार्य करते थे, जो काफी सरल होता था। लेकिन यूनिकोड 16 बिट कूटों में इनको संसाधित करने में कई तरह की जटिल समस्याएँ पैदा हो रही हैं, जैसे--
हिन्दी देवनागरी के अक्षर केवल मूल मानकीकृत कूट में संसाधित व प्रदर्शित नहीं हो पाते। उन्हें जटिल टीएसआर प्रोग्राम के तहत उड़ते-उड़ते ताण्डव नृत्य करना पड़ता है। संसाधन के लिए एक प्रकार के कूट और दिखाने व छापने के लिए दूसरे प्रकार के कूट, जो ओपेन टाइप फोंट्स के जटिल ग्लीफ (अक्षरों के टुकड़े या मात्रा या कई अक्षर मिलकर बने संयुक्ताक्षरों) रूपान्तरण अलगोरिद्म के आधार पर ट्विस्ट करते रहते हैं। जैसे हाथी के दाँत खाने के और तथा दिखाने के और।
देवनागरी वर्णक्रम-निर्धारण का मानकीकरण आज तक नहीं हो पाया है। जो शब्दकोशों के निर्माण का ठोस आधार है।
देवनागरी की मानकीकृत वर्तनी का कम्प्यूटर के सन्दर्भ में संशोधन नितान्त आवश्यक है।
देवनागरी के लिए भी अंग्रेजी के कोरियर फोंट के समरूप निर्धारित चौड़ाई वाले (फिक्स विड्थ) अक्षरों/फोंट्स की नितान्त आवश्यकता है, जो शब्द के मूलाक्षर की गिनती करने और तदनुरूप हर खाने में अक्षर के आधार पर डैटाबेस फोर्मेट के फील्ड साइज को निर्धारित व प्रदर्शित कर सके।
अधिकांशतः हिन्दी देवनागरी के विद्वान आपस में बेकार चर्चा अधिक करते हैं व तकनीकी काम व समाधान कम। आवश्यकता है कि वे इन समस्याओं को समझें और उन्हें दूर करने के लिए अपना तकनीकी ज्ञान बढ़ायें और एक जुट होकर कार्य करें।
फिलहाल जो डेवलपर देवनागरी हिन्दी के लिए कार्य कर रहे हैं, निःशुल्क अमूल्य तकनीकी सेवा प्रदान कर रहे हैं, उनका हिन्दी ज्ञान नगण्य है। उनकी सुविधा के लिए अंग्रेजी में लिखना जरूरी हो जाता है।
अंग्रेजों ने हिन्दुस्तान पर शासन करने के पहले स्वयं हिन्दी सीखी थी, टूटी-फूटी हिन्दी में बोलकर ही वे यहाँ पर अंग्रेजी का साम्राज्य लाद सके थे, जो आज तक नहीं मिट पाया है। इसी प्रकार हमें भी हिन्दी का साम्राज्य फैलाना है तो अंग्रेजी का यथा-आवश्यक सहारा लेने में कभी शर्म, हिचकिचाहट या थोथा-घमण्ड आड़े नहीं आने देना चाहिए।
देवनागरी का जो कूट-निर्धारण यूनिकोड इंक ने किया है, वह इस्की-1988 पर आधारित है, उसमें मूलभूत त्रुटियाँ रह गईं हैं, जिससे संसार की सबसे सरल एवं सबसे सुसंस्कृत लिपि "जटिल" बन गई है। यूनिकोड की "स्टेबिलिटी पॉलिसी" किसी परिवर्तन की इजाजत नहीं देती, चाहे वह सम्पूर्णतः गलत ही क्यों न हो। न तो वे भारत सरकार की सिफारिश पर सकारात्मक सुनावाई करते हैं और न ही भारत के तकनीकी विद्वानों की उचित मांग पर। अन्ततः शायद अमेरिकी वीटो पावर के आगे सबको नतमस्तक होना पड़ता है।
अतः फिलहाल विभिन्न तकनीकी संस्थानों (आई.आई.टी.) द्वारा हिन्दी-देवनागरी व अन्य भारतीय भाषाओं में जो भी "प्राकृतिक भाषा संसाधन" (NLP) के विकास कार्य जारी हैं, वे एक अति सरल 7-बिट कूट में संसाधित व विकसित किए जाते हैं और फिर भूमण्डलीय समतुल्यता के लिए यूनिकोड में बदले जाते हैं। अतः आवश्यकता है कि देवनागरी के मौलिक स्वरूप के अनुरूप एक सरल अक्षर-कूट का निर्धारण किया जाए एवं सबसे पहले उपयोगकर्ताओं का एक समूह बनाकर "प्राईवेट" स्तर पर इसे "मानकीकृत" का ठप्पा लगाया जाए। फिर राष्ट्रीय स्तर पर एवं ततपश्चात् अन्तर्राष्ट्रीय स्तर पर मानकीकरण/स्वीकृति के लिए संघर्ष किया जाए।
देवनागरी-हिन्दी में कुछ तर्कहीन और अवैज्ञानिक पारम्परिक प्रचलन हैं, जो भाषा व लिपि को अति क्लिष्ट बनाते हैं, इनको सरलीकरण करके मानकीकरण करना भी नितान्त आवश्यक है।
हरिराम
On 11/10/06, hindi वर्ग <nor...@googlegroups.com> wrote:
द्वारा: "kalanath mishra"
आप सभी रोमन हिन्दी की बात कर रहे हैं क्या? यदि नहीं तो देवनागरी मे क्यों नही
बात करते. अब तो लिखना बहुत कठिन नही है.