با TTS بیشتر آشنا شوید و دانلود دهها نمونه صدای نرم افزارهای تبدیل متن به گفتار (TTS)

261 views
Skip to first unread message

Aliasghar Assadi

unread,
Jan 10, 2014, 5:22:43 AM1/10/14
to reza...@googlegroups.com
ب نام خدایی که بود و نبود ما جز به اراده ی او نیست.
با سلام در این پست قصد دارم اندکی پیرامون نرم افزارهای مبدل متن به
گفتاریا TTS (Text To Speech) با شما صحبت کنم.
این نرم افزارها چنانچه می دانید، به گروهی از نرم افزارها اطلاق می شوند
که توانایی تبدیل متون الکترونیک موجود بر روی دستگاههای مختلف مانند
کامپیوتر، تلفنهای هوشمند و غیره به گفتار را دارند.
البته کاربرد این گروه از نرم افزارها صرفاً به این مورد محدود نمی شود و
به عنوان مثال با پیشرفت تکنولوژی و ارتقای کیفیت اینگونه نرم افزارها،
در حال حاضر برای تولید کتب گویا و نیز برای ایجاد سیستمهای پاسخگویی
اوتوماتیک تلفنی نیز به کار می روند.
با ترکیب این سیستم و سیستم تشخیص خودکار گفتار یا ASR (Automatic Speech
Recognition) این توانایی در سیستمهای پاسخگویی به وجود آمده که با تشخیص
و پردازش صدای کاربران پاسخ مناسب را برای آنان و درخواستهایشان فراهم
سازند.
علاوه بر این، سیستم تشخیص صدا به کامپیوتر و تلفنهای هوشمند نیز راه
یافته و به عنوان دو مثال از این تکنولوژی می توان به Google Voice برای
تلفنهای دارای سیستم عامل اندروید و نیزی CIRI برای دستگاههای شرکت اپل
اشاره کرد که با بهره گیری از تکنولوژیهای بسیار نوین و پردازش صدای
کاربران خود، با آنها ارتباط برقرار می کنند و پس از پردازش صدا، پاسخ
سیستم برای آنان توسط نرم افزار مبدل متن به گفتار یا همان TTS, خوانده
می شود.
نرم افزارهای تبدیل متن به گفتار علاوه بر موارد فوق، به کمک افراد دارای
آسیب بینایی و افرادی آمده که قدرت تکلم خود را از دست داده اند.
با تولید نرم افزارهای صفحه خوان، این مبدل متن به گفتار است که در تعامل
با نرم افزار صفحه خوان، متون موجود بر روی صفحه ی نمایش را برای افراد
نابینا می خواند و یا افرادی را که قدرت تکلم خود را از دست داده
اند،قادر می سازد با صدایی بسیار طبیعی با جهان خارج ارتباط برقرار کنند.
شاید برای شما این سؤال پیش آمده باشد که تا کنون برای چند زبان نرم
افزار تبدیل متن به گفتار تولید شده و اساساً چند شرکت در این زمینه در
سطوح ملی یا بین المللی فعال هستند؟
برای پاسخ به این سؤال، کمی حوصله به خرج دهید.
در عرصه ی بین المللی، بزرگترین شرکتهایی که در این عرصه فعال هستند عبارتند از:
Microsoft, IBM, AT&T, Neospeech, Acapela TTS Group, Nuance و Cepstral.
علاوه بر موارد بالا، افراد و دانشگاهها و یا موسساتی نیز در این کار
طبعآزمایی کرده اند و با ارایه ی پروژه های رایگان در این عرصه دست به
آزمون و خطا زده اند.
از جمله ی این پروژه ها می توان به پروژه ی رایگان و متنباز (Open
Source) ESpeak, Festival و Mbrola اشاره کرد.
در حال حاضر، کارآمدترین پروژه ی رایگان، ESpeak می باشد که هم اکنون از
دهها زبان و لهجه از جمله زبان شیرین و کهن فارسی پشتیبانی می کند.
با پیشرفت این تکنولوژی در اوایل قرن 21، شرکت Loquendo برای نخستین بار
دست به تولید انسانیترین و طبیعیترین نسل TTS زد.
نرم افزارهای این شرکت به راحتی حتی می توانند برای تولید یک نمایش نیز
به کار روند چرا که می توانند تعجب کنند، غمگین شوند، خوشحال شوند، عطسه،
سرفه، خنده و گریه کنند و حتی با جیغ زدن و سوت زدن نیز کار خود را با
تنوع بیشتری انجام دهند.
چند سال پیش، شرکت Nuance, با خرید این شرکت، عملاً به بزرگترین شرکت
تولید نرم افزارهای مبدل متن به گفتار (TTS) تبدیل شد.
بحث در این مورد بسیار است ولی در پایان از شما دعوت می کنم در این پست،
در سه بخش و با فرمت "Rar” مجموعه ی نفیسی را دانلود کنید که بنده برای
گردآوری آن تلاش فراوانی را در طول حدود 8 سال متحمل شدم.
امیدوارم با گوش دادن به این نمونه ها و مقایسه ی نرم افزارهای فارسیخوان
فعلی، بهتر بتوانید به داوری پیرامون این نرم افزارها بنشینید و بدون
حسرت خوردن در مورد کیفیت بسیار متفاوت این نرم افزارها در زبانهای دیگر،
امیدوار باشید که در آینده چنین کیفیتی نیز در مورد نرم افزارهای متنخوان
فارسی نیز به وجود بیاید.
در این مجموعه می توانید نمونه هایی از دهها زبانرا بشنوید.
برای نمونه به تعدادی از این زبانها اشاره می کنم:
انگلیسی به لهجه های آمریکایی، بریتانیایی، ایرلندی، ولزی، استرالیایی،
اسکاتلندی، هندی و آفریقای جنوبی، فرانسوی به لهجه ی کانادایی و فرانسه،
آلمانی، ترکی استانبولی، اندونزیایی، اسپانیایی به لهجه های مکزیکی،
شیلی، کلمبیا، آمریکایی، کاستیلی، ایالت والنسیا، و ایالت کاتالونیا،
پرتغالی به لهجه ی پرتغال و برزیل، هندی، عربی، مجارستانی، لهستانی،
رومانیایی، ایتالیایی، نوروژی، سوئدی، دانمارکی، ایسلندی، چکی، اسلواکی،
روسی، یونانی، هلندی، فنلاندی، تایلندی، ژاپنی، کره ای، چینی به لهجه ی
چین و لهجه ی تایوان و غیره.

نکته: در این فایلها که به حضور شما عرضه می شود، به دلیل آشنایی شما با
صداهای فارسی و نیز صدای Espeak و Eloquence, از قرار دادن نمونه ی صدای
این دو نرم افزار و نمونه صدای نرم افزارهای فارسیخوان مانند پارسآوا،
آریانا، ماهور و محصولات شرکت پکتوس خودداری کردم.
دانلود بخش اول:
http://content.wuala.com/contents/AliasgharAssadi/Documents/Part1OfTTSDemos.rar?dl=1&id=25,3354228,13-35,3354228,18
دانلود بخش دوم:
http://content.wuala.com/contents/AliasgharAssadi/Documents/TTSTestFiles/Part2OfTTSDemos.rar?dl=1&id=25,3354228,13-41,3354228,18
دانلود بخش سوم:
http://content.wuala.com/contents/AliasgharAssadi/Documents/TTSTestFiles/Part3OfTTSDemos.rar?dl=1&id=25,3354228,13-43,3354228,18
Reply all
Reply to author
Forward
0 new messages