उर्दू से देवनागरी लिपि में बदलने का साफ्टवेयर

493 views
Skip to first unread message

अनुनाद

unread,
May 20, 2008, 11:03:05 AM5/20/08
to Chithakar

अब इस उपकरण को और अधिक परिष्कृत करके वैज्ञानिक एवं तकनीकी हिन्दी
चर्चा-समूह नें डाल दिया गया है।

Urdu to Devanagari script converter_09.htm
http://groups.google.com/group/technical-hindi/web/Urdu%20to%20Devanagari%20script%20converter_09.htm


अब यह लगभग समझने लायक आउटपुट दे रहा है। इसका परिणाम देखकर मुझे पूरा
विश्वास हो गया है कि अगले संस्करण में यह ९०% सही परिणाम देगा जो कि
समझने के लिये पर्याप्त होगा।

इस कार्य के लिये मुझे उर्दू शब्दों की सूची चाहिये जो उर्दू के साथ-
साथ देवनागरी लिपि में भी हो। अच्छा परिणाम आने के लिये इसमें कम से कम
पांच हजार शब्द होने चाहिये।

ऊर्दू में अनेक स्वरों एवं मात्राओं के लिये एक ही संकेत के प्रयोग की
समस्या बहुत ही दोषपूर्ण है। अपने में से जो बन्धु उर्दू लिपि की थोड़ी-
बहुत जानकारी रखते हैं वे कृपया बतायें कि मात्राओं की समस्या से कैसे
प्रभावी ढ़ंग से निपटा जाय।

Sagar Nahar

unread,
May 20, 2008, 11:59:04 AM5/20/08
to Chit...@googlegroups.com
यह संस्करण भी आजमा कर देखते हैं।
मैने बीबीसी उर्दू के जाल स्थल पर से एक मैटर कॉपी कर पेस्ट किया तो निम्न परिणाम मिला।

ک کے درمیان جاری مذاکراتی عمل کو آگے بڑھانے پر اتفاق کیا ہے۔

क के दरमीान जारी मज़ाकराती ेमल को आगि बड़ानि पर ातफ़ाक़ क्या हि


पहले संस्करण में तो एकाद  अक्षर ही दिकते थे बाकी **** ( तारे के चि्ह) दिख रहे थे।  यानि पहले से बहुत सुधरा है, बहुत बहुत बधाई।

2008/5/20 अनुनाद <anu...@gmail.com>:

इस कार्य के लिये मुझे  उर्दू शब्दों की सूची चाहिये जो  उर्दू के साथ-
साथ देवनागरी लिपि में भी हो।  अच्छा परिणाम आने के लिये इसमें कम से कम
पांच हजार शब्द होने चाहिये।
ऊर्दू में अनेक स्वरों एवं मात्राओं  के लिये एक ही संकेत के प्रयोग  की
समस्या बहुत ही  दोषपूर्ण है।  अपने में से जो बन्धु उर्दू लिपि की  थोड़ी-
बहुत जानकारी रखते हैं वे कृपया बतायें कि मात्राओं  की समस्या से  कैसे
प्रभावी ढ़ंग से निपटा जाय।
इस मामले में शुएब भाई आपके लिये बहुत मददगार साबित हो सकते हैं, उन्हें  उर्दू  की बहुत अच्छी जानकारी है।
परन्तु आजकल वे ओनलाइन भी नहीं दिखते, शायद बहुत ज्यादा व्यस्त रहते होंगे।

--
सागर चन्द नाहर
www.nahar.wordpress.com ॥दस्तक॥
www.techchittha.blogspot.com तकनीक
www.mahaphil.blogspot.com गीतों की महफिल

narayan prasad

unread,
May 20, 2008, 1:09:10 PM5/20/08
to Chit...@googlegroups.com
<<अपने में से जो बन्धु उर्दू लिपि की  थोड़ी-बहुत जानकारी रखते हैं वे कृपया बतायें कि मात्राओं  की समस्या से  कैसे प्रभावी ढ़ंग से निपटा जाय।>>
 
अनुनाद जी,
उर्दू लिपि तो मुझे अच्छी तरह मालूम है । आप भी आसानी से सीख सकते हैं ।
 
यदि आप इस परिवर्तक को अच्छा रूप देना चाहते हैं तो आपको यह लिपि सीखनी ही चाहिए । मैं यह भी परामर्श दूँगा कि जिस उर्दू-हिन्दी शब्दकोश का मैंने अपने पूर्व-सन्देश में उल्लेख किया है उसे आप एक बार अवश्य देखें ।
---नारायण प्रसाद

 
२००८-०५-२० को, अनुनाद <anu...@gmail.com> ने लिखा:

Ravishankar Shrivastava

unread,
May 20, 2008, 8:32:13 PM5/20/08
to Chit...@googlegroups.com
narayan prasad wrote:
> <<अपने में से जो बन्धु उर्दू लिपि की थोड़ी-बहुत जानकारी रखते हैं वे कृपया बतायें कि
> मात्राओं की समस्या से कैसे प्रभावी ढ़ंग से निपटा जाय।>>
>
> अनुनाद जी,
> उर्दू लिपि तो मुझे अच्छी तरह मालूम है । आप भी आसानी से सीख सकते हैं ।
>
सही कहा आपने. उच्चारण एक होने के कारण लिपि सीखना आसान है. कोई बीसेक साल पहले मैंने
एकाध हफ़्ते के प्रयास से ही उर्दू अखबार पढ़ना सीख लिया था और छोटे वाक्य लिखना भी.
हालाकि लिखना थोड़ा सा कठिन है.

और, थोड़े से अतिरिक्त डाटाबेस से यह परिवर्तक काम लायक तो हो ही जाएगा.

रवि

Anunad Singh

unread,
May 20, 2008, 11:56:01 PM5/20/08
to Chit...@googlegroups.com
नारायण जी,

आपका परामर्श पूर्णत: तर्कसंगत है। किन्तु मुझे अब समझ में आ  गया है कि उर्दू-देवनागरी लिप्यन्तरण किन्ही नियमों के सहारे करना समभव नहीं है क्योंकि यहाँ  नियमों  का अस्तित्व ही नहीं है। यहाँ  उर्दू और देवनागरी के तुल्य  शब्दों का डेटाबेस का प्रयोग ही ही सबसे कारगर होगा।  इसलिये मैं इस डेटाबेस को बढ़ाने के बारे में सोच रहा हूँ। मुझे इसका एक मशीनी समाधान भी मिल गया है। 


नारायण जी, आपके द्वारा सुझाया गया शब्दकोश  आनलाइन नहीं होने से सम्प्रति इस कार्य में मेरी कोई मदद नहीं कर पायेगा। मै तो ऐसा कुछ खोज कर रहा हूँ जिसे 'कट-पेस्ट' करके काम चलाया जा सके।


एक चीज और जानना चाहता हूँ। कहीं पर  ऊर्दू के  सर्वाधिक प्रयुक्त शब्दों (most frequently used words) (कोई एक हजार) की सूची मिल सकती है? इसके मिलने से इस प्रोग्राम में बहुत अधिक निखार आ जायेगा  क्योंकि यदी बारबार प्रयोग होने वाले शब्दों को इसके डेटाबेस में जोड़ दिया जाय तो कम संख्या में होते हुए भी वे किसी पाठ का लगभग ८०% होते हैं। कम मासाले से अधिक स्वाद।




Vinay

unread,
May 21, 2008, 9:20:04 AM5/21/08
to Chithakar
5000 शब्दों की सूची -
http://www.crulp.org/software/ling_resources/UrduHighFreqWords.htm

परेशानी बस यह है कि एक तो यह पीडीएफ में है, दूसरी केवल उर्दू लिपि में.
मैं ख़ुद भी इसे किसी से ITRANSed (जिससे फिर देवनागरी परिवर्तन सरल है)
कराने की फिराक़ में हूँ. पर इसका कॉर्पस अच्छा खासा लगता है और अगर ये
काम में लाई जा सके तो बहुत अच्छा होगा. लाइसेंसिंग क्रिएटिव कॉमन्स (by-
nc-ca) है इसलिए उपयोग में कोई कानूनी अड़चन भी नहीं है.

Anunad Singh

unread,
May 21, 2008, 11:38:58 AM5/21/08
to Chit...@googlegroups.com
उर्दु से देवनागरी लिप्यन्तरण प्रोग्राम का अद्यतन संस्करण  अब  फायरफाक्स एवं  इन्टरनेट इक्स्प्लोरर दोनो में काम कर रहा है।  इसका  शब्दकोश भी ठोड़ा ब.दा कर दिया है।

इसे वैज्ञानिक एवं तकनीकी हिन्दी समूह पर  डाल दिया हूँ।

Anunad Singh

unread,
May 22, 2008, 8:10:56 AM5/22/08
to Chit...@googlegroups.com
विनय,
यह सर्वाधिक प्रयुक्त उर्दू शब्दावली बहुत काम आये यदि कोई उर्दू का जानकार इन उर्दू शब्दों के साथ संगत देवनागरी शब्दों  को टाइप कर दे।

है कोई वीर जो सौ-दो सौ शब्दों का भी लिप्यन्तरण कर्के दे सके ?

============================================

२००८ मई २१ १८:५० को, Vinay <vinay...@gmail.com> ने लिखा:

5000 शब्दों की सूची -
http://www.crulp.org/software/ling_resources/UrduHighFreqWords.htm

परेशानी बस यह है कि एक तो यह पीडीएफ में है, दूसरी केवल उर्दू लिपि में.
मैं ख़ुद भी इसे किसी से ITRANSed (जिससे फिर देवनागरी परिवर्तन सरल है)
कराने की फिराक़ में हूँ. पर इसका कॉर्पस अच्छा खासा लगता है और अगर ये
काम में लाई जा सके तो बहुत अच्छा होगा. लाइसेंसिंग क्रिएटिव कॉमन्स (by-
nc-ca) है इसलिए उपयोग में कोई कानूनी अड़चन भी नहीं है.
--~--~---------~--~----~------------~-------~--~----~


भावना महेता - Bhavna Mehta

unread,
May 22, 2008, 3:30:15 PM5/22/08
to Chit...@googlegroups.com
I would like to help. I can read both Hindi and Urdu. If I understand correctly then Urdu words in the attached link - 5000 most used urdu words needs to be typed in Hindi ...Is that so? If so I can copy this into Word Document - Create a column and type in Hindi the corresponding word. Please let me know if I understand it correctly. 
 
Thanks
 
Bhavna

Ravishankar Shrivastava

unread,
May 22, 2008, 9:52:54 PM5/22/08
to Chit...@googlegroups.com
भावना महेता - Bhavna Mehta wrote:
> I would like to help. I can read both Hindi and Urdu. If I understand
> correctly then Urdu words in the attached link - 5000 most used urdu
> words needs to be typed in Hindi ...Is that so? If so I can copy this
> into Word Document - Create a column and type in Hindi the
> corresponding word. Please let me know if I understand it correctly.
>
> Thanks
>
> Bhavna
>
Great! I had downloaded the Urdu word list in Unicode from same site. I
am sending it to you and anunad ji. Will try to upload as Google Doc so
that it will be edited online.

Regards,
Ravi

Anunad Singh

unread,
May 22, 2008, 11:49:12 PM5/22/08
to Chit...@googlegroups.com
जी भावना जी,
आपने बिल्कुल सही समझा है । उर्दू में यदि 'वक्त" है तो उसके सामने  हिन्दी में (मतलब, देवनागरी में)  'वक्त' लिखिये ( किन्तु, 'समय' नहीं )



=====================================================
2008/5/23 Ravishankar Shrivastava <ravir...@gmail.com>:

भावना महेता - Bhavna Mehta

unread,
May 23, 2008, 12:11:06 PM5/23/08
to Chit...@googlegroups.com
Ravi ji
 
Please let me know if you uploaded the unicode version if the document and how I can access it as Google doc. I will starting working on this as much as I can on this weekend an in the next week.
 
Thanks
 
Bhavna

peekay

unread,
May 22, 2008, 8:39:58 PM5/22/08
to Chit...@googlegroups.com
request .. can you also create an excel file pls
this will help in sorting, sub-string generating, syllable generating, etc

Ravishankar Shrivastava

unread,
May 25, 2008, 3:25:37 AM5/25/08
to Chit...@googlegroups.com
Bhavna Ji,
 
The file I had sen you is indeed unicode one. Will try to upload as spreadsheet doc soon.
 
Regards,
Ravi

 

Ravishankar Shrivastava

unread,
May 25, 2008, 3:26:40 AM5/25/08
to Chit...@googlegroups.com
Yes,  I will split the file in hunk of say 5000 words an soon upload it.
 
Regards,
Ravi

 

भावना महेता - Bhavna Mehta

unread,
May 27, 2008, 12:59:32 PM5/27/08
to Chit...@googlegroups.com
Ravi Ji -
 
Thank you for wordlist.txt
 
I have started working on this.  At a time I am moving 25/30 words to Excel and I have created 3 coulmns one for Hindi and one for English too. Just in case I have made any Hindi spelling mistakes it can be corrected by seeing the English Word.  When I tried to open the doc doc it took forever - but never opened ...but the wordlist.txt is fine.

Regards
 
Bhavna
Reply all
Reply to author
Forward
0 new messages