در خصوص آزادسازی پروژه های پردازش زبان

23 views
Skip to first unread message

mehdi einali

unread,
May 21, 2018, 3:25:12 AM5/21/18
to did...@itrc.ac.ir, Mohammad Khansari, Mohammad Khansari
به نام خدا
با سلام

چهار ماه در خبرها امده است که پروژه های مربوط به خط و زبان فارسی که توسط پژوهشگاه فناوری اطلاعات انجام شده اند، آزادسازی خواهند شد.


اکنون با وجود آنکه نزدیک ۴ ماه از مصاحبه اقای دکتر یاری در این خصوص می گذرد ولی متاسفانه خبری از اقدام عملی در این خصوص به گوش نمی رسد.

با توجه به اهمیت زمان در کارهای پژوهشی و کاهش مداوم ارزش برخی خروجی ها در طول زمان به نظر می رسد، هر چقدر این کار با تاخیر انجام شود، تاثیر آن نیز کمتر خواهد بود. و چه بسا برخی خروجی ها با توجه تغییرات مداوم در حوزه های پژوهشی دیگر ارزشی برای استفاده در محیط واقعی نداشته باشند. اتفاقی که پیشتر برای برخی از پژوهش های مرکز تحقیقات افتاده است. 

به عنوان مثال برخواست شرکت ما برای ابزار پارسی پرداز که چنان در پیچ و خم دفتر ارتباط با صنعت و دایره حقوقی مرکز دچار مشکل شد که در مدت رفت آمد برای دریافت آن ابزار توانستیم نمونه بهتری را هزینه بسیار کم تولید کنیم.(در طی مذاکرات مرکز از ما در ابتدا درخواست ۵۰-۷۰ میلیون تومان پول و سپس همین مقدار سفته به عنوان وثیقه کرد. که ابزار تولید شده به دلیل کیفیت پایین، ارزش قبول ریسک وثیقه را نیز نداشت. جالب آنکه آن ابزار الان پس از ۲-۳ سال همان میزان ارزش گذشته را هم ندارد و طرفه آنکه هنوز مرکز برای آزادسازی همان نیز تردید دارد.)

به نظر من این سرنوشت بسیاری از کارهای پژوهشی مرکز خواهد بود. کارهای پژوهشی که تنها با ارزیابی های دانشگاهی تولید شده اند بسیاری از اوقات هیچ گاه برای دقت و ارزش واقعی محک زده نمی شوند و چون باز تنها به کار طرحهای پژوهشی  می آیند و چون پادشاه لخت داستان کریستین اندرسن کسی جرات اظهار نظر در خصوص کیفیت واقعی آن ها را ندارد.  و این مثالی است از دره عمیق میان علم(مصطلح در پژوهشگاه ها و دانشگاه های کشور) و فناوری کاربردی در صنعت  که توجیه گر وضع موجود دانشگاه های سترون و صنعت عقب مانده کشور است.

این قصه پردردی است که  حتیبرخی اوقات دانشجویان در آزمایشگاه های پردازش زبان دانشگاه های مختلف و گاهی کارهای پژوهشی در یک دانشگاه توسط اساتید مختلف مجبور به باز تولید پیکره ها و ابزارهای تکراری هستند زیرا همه بخش های پژوهشی خروجی های دادگان و ابزارهای پایه پردازش زبان خود را به چشم دارایی های ارزشمندی می بینند. 
دقت کنید که من درخصوص دادگان و ابزارهای پایه پردازش زبان حرف می زنم در بسیاری از کشورهای سابقه تولید و عمومی سازی آن ها به بیش از ۱۵-۲۰ سال می رسد نه پژوهش های بروز بر روی ابزارهای سطح بالا که قطعن حق هر محققی است که از مالکیت فکری کار پژوهشی خود دفاع نماید و هیچ شرکت تجاری نیز انتظار دسترسی به آنها به صورت رایگان را ندارد و صد البته ترجیح می دهد برای خود بر روی آنها و بر اساس مساله خاص محصولات خود کار تحقیق و توسعه انجام دهد. 

بخش  بسیار دردناک این قضیه آن است که برخی دانشگاه های خارجی بسیار سخاوتمندانه تر و با دید دلسوزانه تری نسبت به گسترش پردازش زبان فارسی اقدام به انتشار خروجی کارهای خود می نمایند تا برخی مراکز دولتی و دانشگاهی کشور که با هزینه دولتی مدیریت می شوند!! که وعده تو کردی و او به جا آورد!!!

به عنوان مثال می توانید به پیوندهای زیر مراجعه نمایید:
  • http://stp.lingfil.uu.se/~mojgan
  • ابزارهای پردازش متن فارسی و دادگان آموزش برای بسیار الگوریتم ها مربوط به دانشگاه اوپلاسای سوئد
  • http://en.persianspeechcorpus.com/
  • خروجی دادگان آموزش برای پردازش متن مربوط به دانشگاه ساوتهمتون انگلستان

لازم به ذکر است که ما سه سال پیش با پیگیری توانستیم نسخه ۲ فارس نت را به عنوان یک ابزار بازمتن در اختیار بگیریم. ولی تقریبا از همان زمان قولهایی از مدیران مرکز تحقیقات برای آزادسازی دیگر خروجی های مرکز در حوزه پردازش زبان فارسی شنیده ایم که متاسفانه هنوز هم فقط تکرار می شوند. 

انگیزه این نامه دیدن مصاحبه ای از جناب اقای دکتر یاری به تاریخ ۲ بهمن پارسال و تکرار مجدد قول آزادسازی خروجی کارهای پژوهشی مرکز بود. خواستم از چشمان کسی که از بیرون در سه سال گذشته ناظر ماجرا بوده است روایت خود را بگویم.

وگرنه شرکت ما در این مدت با سرمایه گذاری و پژوهش مداوم بسیاری از ابزارهای مورد نیاز خود با باسطح دقتی که برای کار در صنعت نیاز است تهیه کرده است و دیگر چشم امیدی به کارهای پژوهشی دانشگاهی و دولتی  در این حوزه ندارد.


با عرض ادب و احترام                  
مهدی عینعلی                     
مدیر فنی شرکت فناوران هوشمند شایا         
فعال در زمینه پردازش زبان فارسی و هوش مصنوعی


رونوشت:
جناب آقای دکتر خوانساری، رییس پژوهشگاه فناوری اطلاعات






Reply all
Reply to author
Forward
0 new messages