සිංහලෙන් පරිගනකයෙන් වැඩ ගන්න අදහස් ටිකක්

20 views
Skip to first unread message

විශ්ව කුමාර

unread,
Oct 4, 2007, 1:12:24 PM10/4/07
to සිංහල යුනිකෝඩ් සමූහය - Sinhala Unicode Group
සිංහලෙන් පරිගනකයෙන් වැඩ ගන්න නම් අවශ්‍යතාවය හරියට හඳුනාගන්න ඔ‌්නා. මම
මේ කියන්නේ හොඳ ප්‍රායෝගික අදහස් ටිකක් ඔලුවට ආපු නිසා.

සිංහලෙන් වෙබ් අඩවි හැදුවාට එ‌්වාට dynamic content ඇතුල් කරන්න ක්‍රමයක්
ඔ‌්නා. මොකද හැමෝටම ටයිප් කරන්න බැරි හින්දා. එ‌්කට අපිට කතා කරන වචන
සිංහල යුනිකේත වලට හරවන මෘදුකාංග අවශ්‍ය වනවා.

අනෙක තමයි යුනිකේත සිංහල ආපසු සිංහල කතාකරන ශබ්ද වලට පෙරලන්න පුලුවන්
මෘදුකාංග. මේක නම් මට කරන්න පුලුවන්.

අපි හිතමු සිංහල විතරක් දන්න කෙනෙකුට මොකක් හරි භාන්ඩයක් විකුණගන්න ඔ‌්නා
කියලා. හරියට eBay වගේ. එයාට එ‌්කේ විස්තර කටින් කියලා, අකුරු ටික වෙබ්
පිටුවට ඇතුල් කරන්න ක්‍රමයක් තියනවනම් බොහෝ දෙනාට ප්‍රයෝජනවත් වේවි. ඊලඟට
එ‌් භාන්ඩය අවශ්‍ය කෙනාට key words කටින් කියලා හොයාගන්න පුලුවන්. මොකද
කටින් කියන එක වචන වලට කඩාගත්තහම එ‌්ක සාමාන්‍ය වෙබ් සර්ච් එකක්.

කටින් කියන වචන ඉංග්‍රිසි අකුරු වලට හරවලා දෙනවානම් සිංහලට හරවලා ඉතරී
ටික මටත් කරන්න පුලුවන්.

අනිත් එක තමයි එහා කෙරවලේ කෙනාට හරියට කියවගන්න බැරිනම් එ‌්ක කනෙන් අහන
විදිහක් හදන එක. මම කියන්නෙ text to speach වගේ එකක්. මේ දෙකම බ්‍රව්සර්
එකටම ඇමිනුවොත් හොඳයි නේද.

එතකොට මේ උදාහරනය ගත්තේ අන්තර්ජාලය පාවිච්චි කරලා සාමාන්‍ය සිංහල (විතරක්
දන්න) මනුස්සයෙකුට භාන්ඩයක් විකුනගන්න / හොයාගන්න අවස්ථාවක් (senario).
තව මේවගේ අවස්ථා (senario) ටිකක් හඳුනාගත්තොත් හොඳ ආරම්භයක් වේවි.

නිරංජන්෴

unread,
Oct 4, 2007, 6:06:25 PM10/4/07
to සිංහල යුනිකෝඩ් සමූහය - Sinhala Unicode Group
සිංහල විතරක්ම දන්න පරිගණක භාවිතා කරන අය ඉන්නවා, නමුත් ඒ ඉතාම ටිකයි.
මවුස් එක කියලා දීලා, සයිට් එක දාලා දුන්නාම හල්දුම්මුල්ල පංසලේ සීයා
කෙනෙක් ලංකාදීපය කියෙව්වා. Howsthat?

සාමාන්‍යයෙන්වත් ඉංග්‍රීසි දන්න අය තමා පරිගණක භාවිතා කරන්නේ. ඔවුනගේ
ප්‍රධාන අවශ්‍යතාවය උපදෙස්,තොරතුරු ආදිය සිංහල වීම. මුහුණතේ සිංහල‍ තිබීම
ඉතාම හොඳයි, ශිල්ප සයුර හැදුවේ එහෙමයි. අපි සිංහල වැඩ නොකරන drop down
box අතහැරියා මුහුණතින්.

විශ්ව කුමාර

unread,
Oct 4, 2007, 9:42:19 PM10/4/07
to සිංහල යුනිකෝඩ් සමූහය - Sinhala Unicode Group
මම අදහස් කලේ ඉංග්‍රිසි නොදන්න නිසා මෙච්චර කල් කම්පියුටර්, ඉන්ටර්නෙට්
පාවිච්චි කරන්න බැරි වුන අය ගැන.

මම සම්පූර්ණයෙන් සිංහල අතුරුමුහුනතක් තියන POS සිස්ටම් එකක් හැදුවා. එ්ක
පාවිච්චි කරන කෙනා දැන් නම් අතුරුමුහුනත බලන්නේවත් නැහැ. සමහරු "අපෝ
සිංහලනේ!" කියලා කියනවත් ඇහිලා තියනවා.

සිංහල unicode text to speech වගේ එකක් හැදුවොත් කොච්චර ප්‍රයෝජනවත්
වේවිද?

Sanjeewa

unread,
Oct 4, 2007, 11:01:29 PM10/4/07
to සිංහල යුනිකෝඩ් සමූහය - Sinhala Unicode Group
සිංහලට අද ලෝකයේ පිළිගැනීමක් ‍ඇති වේගන යනවා. Microsoft සමාගම සිංහලය
පිළිගත්ත එක ලොකු ජයක්.
ඔබේ අදහස ඇත්තෙන්ම හොදයි. එය සිංහලය ලෝකය කරා යන ගමනට පිටිවහලක් වේවා!

Chamara Peiris

unread,
Oct 4, 2007, 11:54:34 PM10/4/07
to Sinhala...@googlegroups.com
අප සාකච්ඡා කර මෙවැනි ව්‍යාපෟති හඳුනාගෙන ඒවා ගොඩ නඟමු.

Cheers,
--
Chamara Peiris | http://apramana.com | +94 712 967 967

හර්ෂණ වීරසිංහ

unread,
Oct 4, 2007, 11:55:03 PM10/4/07
to Sinhala...@googlegroups.com
දැනටමත් UCSC හී Language Technology Research Laboratory මගින් මෙවැනි දෑ කරගෙන යන බව අමතක කල යුතු නොවේ.
ගිහින් බලන්න.

http://www.ucsc.cmb.ac.lk/ltrl/?page=downloads&lang=en&style=default

--
හර්ෂණ | Harshana
www.harshana.info
www.blog.harshana.info

ඉෂාන් www.ishan-liyanage.blogspot.com

unread,
Oct 5, 2007, 12:50:16 AM10/5/07
to සිංහල යුනිකෝඩ් සමූහය - Sinhala Unicode Group
නිරංජන්,

> ඉතාම හොඳයි, ශිල්ප සයුර හැදුවේ එහෙමයි. අපි සිංහල වැඩ නොකරන drop down
> box අතහැරියා මුහුණතින්.

සිංහල වැඩ නොකරන drop down box කියා ඔබ අදහස් කලේ, drop down box සිංහල
සහාය නොදක්වනවා කියාද?

එම්-එන්

unread,
Oct 5, 2007, 3:46:27 AM10/5/07
to සිංහල යුනිකෝඩ් සමූහය - Sinhala Unicode Group
මමත් ඉතා උනන්දුවක් දක්වන ක්ෂේත්‍රයක් තමයි මේක.
සිංහල speech recognition, සිංහල OCR, හා සිංහල text to speech මෘදුකාංග
නිෂ්පාදනය පිළිබදව මම අධ්‍යයනයන් කිහිපයක් සිදුකර තිබෙනවා.
කුඩා ළමුන් සදහා සිංහල text to speech මෘදුකාංගයක් මීට බොහෝ කලකට පෙර මා
VB & MsAgents භාවිතයෙන් නිපදවූවත් එය වැඩිදියුණු කරන්නට බැරිවුනා. එය
යුනිකෝඩ් සම්බන්ධ කටයුත්තක් නොවෙයි. නමුත් මෑතකදී නැවතත් එවන්
මෘදුකාංගයක් යුනිකෝඩ් භාවිතයෙන් හා නිවැරදි සිංහල උච්චාරණයක් සහත 'සිංහල
MsAgent character' කෙනෙක් (මහදැනමුත්තා වැනි ළමුන්ට සමීප චරිතයක්)
ගොඩනගා කරන්නට සිතුනා. ඒ සදහා Ms Agent Character Editor, AudioSDK එකක්
භාවිතා කරමින් මුලපිරුවත් කාර්යබහුලත්වය නිසා වැඩි දෙයක් කරන්නට බැරි
උනා.

එමෙන්ම සිංහල speech recognition එන්ජිමක් හදන්නත් දැඩි උවමනාවක් මට
තිබෙනවා.

සිංහල OCR ගැනත් මා අධ්‍යයනයක් කරමින් සිටිනවා. ඉංග්‍රීසි අකුරු
හදුනාගැනීමේ ක්‍රමවේදයෙන් රවුම් හැඩ ඇති සිංහල අකුරු හදුනාගැනීම ඉතා
අපහසු නිසා සිංහල අකුරු හදුනාගැනීම සදහාම පහසු ක්‍රමවේදයක් ගොඩනගා
අත්හදාබැලීම් කිහිපයක්ම කලා. තවමත් සම්පූර්ණයෙන්ම අධ්‍යයනය ඉවර නැති නිසා
එම ක්‍රමයේ සාර්ථකත්වය පිළිබද අනාවැකි කීමට නොහැකියි. පේරාදෙණි
විශ්වවිද්‍යාලයේ පරිගණක විශේෂ උපාධිය හදාරන සිසුන්ට ඔවුන්ගේ අවසන්
පර්යේෂණය සදහා මා මෙය දෙන්නට ඉදිරිපත් වුනත් එය image processing ගණයේ
එකක් නිසා ඔවුන් එය සංකීර්ණ යැයි සිතනවා.

මේවා සිංහල යුනිකෝඩ් සමග ඍජු සම්බන්ධයක් නැතත් සිංහල භාෂාවෙන් පරිගණක
භාවිතය සදහා ඉතා වැදගත්. මේ පිළිබදව කොළඹ විශ්ව විද්‍යාලයේ භාෂා
පර්ය්ෂණායතනයේ කරගෙන යන පර්යේෂණ ගැන දන්නා අයෙක් සිටීනම් කරැණාකර විස්තර
පවසන්න.

කවුරුන් හෝ මෙවන් පර්යේෂණාත්මක මෘදුකාංග නිපදවමින් සිටිනවා නම් මම
කරගෙනයන දේවල් අතහැරදමා හෝ ඒවාට සහය දෙන්න මම කැමතියි. මොකද වැදගත්
කරන්නේ කවුද කියන එක නෙමෙයි, කරන්නේ මොකක්ද කියන එක නිසා....

නිලක්ෂ
------------------------------------------------------

Malinthe Samarakoon

unread,
Oct 5, 2007, 4:51:48 AM10/5/07
to Sinhala...@googlegroups.com
සිංහල OCR මාදුකාංගයක් කොළඹ විශ්ව විද්‍යාලය මගින් සකසා තිබුණා. නමුත් මට එය හරියට ක්‍රියාත්මක කරගන්නට බැරිවුණා.
මෙතැන බලන්න.
මෙතැනින් සිංහල OCR ලබාන්න.

හර්ෂණ වීරසිංහ

unread,
Oct 5, 2007, 5:00:20 AM10/5/07
to Sinhala...@googlegroups.com
මමත් මෙය භාවිතා කරන්න උත්සහ කලා. නමුත් හරිආකාරව සිදුවුනේ නම් නැහැ.

එම්-එන්

unread,
Oct 5, 2007, 5:23:13 AM10/5/07
to සිංහල යුනිකෝඩ් සමූහය - Sinhala Unicode Group
මමත් මෙය භාවිතාකර බැලුවා... නමුත් අසාර්ථක වුනා...
එයට හේතුව මේක හදලා තියෙන්නේ font වර්ගයට සාපේක්ෂව ක්‍රයාත්මක වෙන්න.
නමුත් scan කල ලිපියක ඇති අකුරු වල හැඩහුරැකම්, උස, මහත, දිග ආදිය හරියටම
font එකට සමාන නොවෙන්න පුළුවන්.
අකුරැ වර්ගයට සාපේක්ෂව ක්‍රයා නොකරන (font independent) ක්‍රමයක් මගින්
මේක විසදගන්න පුළුවන්. නමුත් ඒ සදහා සිංහල අකුරුවලටම හරියන ටිකක් සංකීර්ණ
image processing algorithms හදන්න අවශ්‍යයි.
මම අලුත් ක්‍රමයක් පිළිබද අධ්‍යයනයක් කරමින් සිටියත් තවම සම්පූර්ණයෙන්
අවසන් නැති නිසා එහි සාර්ථක අසාර්ථකභාවය ගැන දැන්ම කියන්න අමාරුයි. නමුත්
ඒ ගැන මට ලොකු විශ්වාසයක් තියනවා. අනික බොරු කියන්න ඕන නැහැනේ, බුද්ධිමය
දේපල ප්‍රශ්නෙත් තියනවා නේ.... ;)

විශ්ව කුමාර

unread,
Oct 5, 2007, 8:41:16 AM10/5/07
to සිංහල යුනිකෝඩ් සමූහය - Sinhala Unicode Group
සිංහලට අද ලෝකයේ පිළිගැනීමක් ‍ඇති වේගන යනවා.

ඔයගොල්ලෝ දන්නවද, ඔස්ටේ්‍රලියාවේ පුරවැසිකම ගන්නකොට සිංහලෙන් ඉඟනගත්තාට
අමතර ලකුණු 5 ක් දෙනවා. ඉංග්‍රීසියට 0 යි.
එ්ගොල්ලොත් සිංහලට ගරු කරනවා. අපේ තමයි නැත්තේ.

විශ්ව කුමාර

unread,
Oct 5, 2007, 8:43:26 AM10/5/07
to සිංහල යුනිකෝඩ් සමූහය - Sinhala Unicode Group
බුද්ධිමය දේපල ප්‍රශ්නෙත් තියනවා නේ...

ඔය අදහස් කරන්නේ සොෆ්ටවෙයා කොපි කරන එක ගැනද? එ‌්කටනම් හොඳ විසඳුම්
තියනවා.

> > හර්ෂණ | Harshanawww.harshana.infowww.blog.harshana.info- Hide quoted text -
>
> - Show quoted text -

එම්-එන්

unread,
Oct 5, 2007, 9:23:59 AM10/5/07
to සිංහල යුනිකෝඩ් සමූහය - Sinhala Unicode Group
නෑ නෑ...
මම අදහස් කලේ අලුත් තාක්ෂණික සංකල්ප එකවරම එලියට දාන්න බැරි නිසා...
කුහකකමට නෙමෙයි....
අපි කොච්චර විවෘතව අනුන්ගේ හිතසුව පිණිස වැඩ කලත් ඒවගෙන් අයුතු ප්‍රයෝජන
ගන්න අය ඉන්න පුළුවන්නේ...
මට ඔහොම වැඩ වෙලා තියනවා...

සෙෆ්ට්වෙයා කොපිකරන එකට තියන හොදම විසදුම/විසදුම් මොනවද?

> > > හර්ෂණ | Harshanawww.harshana.infowww.blog.harshana.info-Hide quoted text -

විශ්ව කුමාර

unread,
Oct 5, 2007, 10:39:04 AM10/5/07
to සිංහල යුනිකෝඩ් සමූහය - Sinhala Unicode Group
මේක බලන්න
http://groups.google.com/group/Sinhala-Unicode/web/SoftwareProtection.png
තව vigilent කියල dongle ජාතියක් තියනවා හොයල බලන්න.

> > > > හර්ෂණ | Harshanawww.harshana.infowww.blog.harshana.info-Hidequoted text -
>
> > > - Show quoted text -- Hide quoted text -

දසුන් සමීර

unread,
Oct 6, 2007, 1:47:13 AM10/6/07
to සිංහල යුනිකෝඩ් සමූහය - Sinhala Unicode Group
අපි‍ හිතන තරම්ම සමාජය කුහක නෑ. මම අවුරුදු 1 1/2 ක් පමණ කාලයක් සිංහල
මෘදුකාංග අලවිකර තියෙනවා. ඒ අතර සමහරකට password protection(විශ්ව කුමාර
කියු පරිදි) එකක් දමා තිබුනත් සමහරකට ඒවා මුකුත් නැතුවත් ‍වෙළඳපොලට
දැම්මා. දැනට නම් කිසිම ගැටළුවක් ඇත්වී නෑ. ඇත්තටම වටින්නේ source code
නො ඒතුල ඇත තාක්ෂණික සංකල්පයි. ඒවැන අවස්ථාවක නො‍මිලේම ලබා දෙන
මෘදුකාංගයක වුනත් close source වලට යාම වරක් නොවේ.

Asanka

unread,
Oct 8, 2007, 12:52:15 AM10/8/07
to සිංහල යුනිකෝඩ් සමූහය - Sinhala Unicode Group
මේ පිළිබඳව නොදන්නා අය සඳහා,

නිදහස් සහ විවෘත මූලාශ්‍රමය සිංහල අක්ෂර සංයෝජකය (OCR)
http://www.ucsc.cmb.ac.lk/ltrl/?page=panl10n_p1&lang=en&style=default#ocr

නිදහස් සහ විවෘත මූලාශ්‍රමය සිංහල යුනිකෝඩ් පෙළ කථනයට හරවන මෘදුකාංගය
(TTS)
http://www.ucsc.cmb.ac.lk/ltrl/projects/si/

ස්ථාපනය කරන අයුරු සහ අනෙක් උපදෙස් ද අඩංගු කර ඇත.

මේචා GPL යටතේ නිකුත්කර ඇති අතර ඔබට ඒචායේ අඩුපාඩු හඳුනාගන වැඩි දියුණු
කළ හැකියි. ඒ සඳහා උනන්දුවක් දක්වන්නේ නම් දන්වන්න..

අසංක වාසල - LTRL

Malinthe Samarakoon

unread,
Oct 8, 2007, 1:56:17 AM10/8/07
to Sinhala...@googlegroups.com
මෙහි OCR වැඩසටහන නම් නිවැරදිව ක්‍රියාත්මක වන්නේම නැත. මේ පිළිබඳව කලිනුත් කියා ඇති බව මතකයි. මේ ගැන දැනුම් දෙන්නට කෙනෙක් ඉන්නවාද?

Asanka

unread,
Oct 8, 2007, 2:21:51 AM10/8/07
to සිංහල යුනිකෝඩ් සමූහය - Sinhala Unicode Group
හිතවත් මලින්ත,

මෙහි නිර්මාතෘ නම් දැන් කේම්බ්‍රිජ් සරසවියට ගිහිල්ලා උසස් අධ්‍යාපනය
සඳහා .. කෙසේ වෙතත් ඔබට ඔහුගේ e-mail ලිපිනය සහ මෙහි source code ලබා දිය
හැකියි. Architechture එක publications කීපයකින් විස්තර කෙරෙනවා .
(http://www.ucsc.cmb.ac.lk/ltrl/?
page=publications&lang=en&style=default - for abstract)

මීට අමතරව අපි බලාපොරොත්තුවෙනවා googleලාගෙ opensource OCR එක සිංහලට/
දෙමළවලට යොදාගත හැකිදැයි පරීක්ෂණයක් කරන්න..

ඔබේ උනන්දුව අගය කරනවා.

ඔබට අපේ lab එක පැත්තේ එන්න හැකියාවක් තියෙනවා නම් මේ පිළබඳව වැඩි විස්තර
කියන්න ලේසියි!

අසංක - LTRL

On Oct 8, 11:56 am, Malinthe Samarakoon <malin...@gmail.com> wrote:
> මෙහි OCR වැඩසටහන නම් නිවැරදිව ක්රියාත්මක වන්නේම නැත. මේ පිළිබඳව කලිනුත් කියා ඇති බව මතකයි. මේ ගැන දැනුම් දෙන්නට කෙනෙක් ඉන්නවාද?

> Asanka wrote:මේ පිළිබඳව නොදන්නා අය සඳහා, නිදහස් සහ විවෘත මූලාශ්රමය සිංහල අක්ෂර සංයෝජකය (OCR)http://www.ucsc.cmb.ac.lk/ltrl/?page=panl10n_p1&lang=en&style=default#ocrනිදහස් සහ විවෘත මූලාශ්රමය සිංහල යුනිකෝඩ් පෙළ කථනයට හරවන මෘදුකාංගය (TTS)http://www.ucsc.cmb.ac.lk/ltrl/projects/si/ස්ථාපනය කරන අයුරු සහ අනෙක් උපදෙස් ද අඩංගු කර ඇත. මේචා GPL යටතේ නිකුත්කර ඇති අතර ඔබට ඒචායේ අඩුපාඩු හඳුනාගන වැඩි දියුණු කළ හැකියි. ඒ සඳහා උනන්දුවක් දක්වන්නේ නම් දන්වන්න.. අසංක වාසල - LTRL On Oct 5, 7:42 am, විශ්ව කුමාර<vishva8kum...@gmail.com>wrote:මම අදහස් කලේ ඉංග්රිසි නොදන්න නිසා මෙච්චර කල් කම්පියුටර්, ඉන්ටර්නෙට් පාවිච්චි කරන්න බැරි වුන අය ගැන. මම සම්පූර්ණයෙන් සිංහල අතුරුමුහුනතක් තියන POS සිස්ටම් එකක් හැදුවා. එ්ක පාවිච්චි කරන කෙනා දැන් නම් අතුරුමුහුනත බලන්නේවත් නැහැ. සමහරු "අපෝ සිංහලනේ!" කියලා කියනවත් ඇහිලා තියනවා. සිංහල unicode text to speech වගේ එකක් හැදුවොත් කොච්චර ප්රයෝජනවත් වේවිද?--

Reply all
Reply to author
Forward
0 new messages