'විද්‍යාව' යන වචනයේ 'ද'යන්න සහ '්‍ය' (යංසය) බැඳි අකුරින් ලියන‍්නේ කොහොම ද?

1,958 views
Skip to first unread message

ලලිත් මානගේ (Lalith Manage)

unread,
Apr 2, 2010, 11:50:29 AM4/2/10
to සිංහල යුනිකෝඩ් සමූහය - Sinhala Unicode Group
'විද්‍යාව' යන වචනයේ 'ද'යන්න සහ '්‍ය' (යංසය) බැඳි අකුරින් ලියන‍්නේ
කොහොම ද?

වාසල මුදියන්සෙලාගේ නිලන්ත පියසිරි (WM Nilantha Piyasiri)

unread,
Apr 5, 2010, 1:09:02 AM4/5/10
to sinhala...@googlegroups.com
යංසය එනවනම් එය සෑම විටම බැදි අකුරක් තමයි. එසේ බැදි අකුරක් වීම නිසා තමයි පෙර අකුර හල් වෙන්නේ.

2010/4/2 ලලිත් මානගේ (Lalith Manage) <lalith...@gmail.com>
'විද්‍යාව' යන වචනයේ 'ද'යන්න සහ '්‍ය' (යංසය) බැඳි අකුරින් ලියන‍්නේ
කොහොම ද?

--
සිංහල යුනිකෝඩ් සමූහය - Sinhala Unicode Group.
මෙම සමූහයට විද්‍යුත් තැපැල් පණිවුඩයක් එවීමට:  Sinhala...@googlegroups.com
දායකත්වයෙන් ඉවත්වීමට මෙම ලිපිනයට ලියන්න: Sinhala-Unico...@googlegroups.com
වෙනත් විකල්ප සඳහා සමූහය වෙත එන්න: http://groups.google.com/group/Sinhala-Unicode?hl=si
If you have trouble reading Sinhala Fonts, please visit http://si.wikipedia.org/wiki/Wikipedia:Sinhala_font for instructions.

To unsubscribe, reply using "remove me" as the subject.



--
#########################
#    ඔබට ආයුබොහෝ වේවා !     #
#########################

Chamila De Alwis

unread,
Apr 2, 2010, 12:02:05 PM4/2/10
to sinhala...@googlegroups.com
පොතේ හැටියට "ද" + "‍\" + "යා" හෝ "ද" + "‍\" + "්‍යා" පිලිවෙලින් ඔය කියන අකුර ලැබෙන්න ඕනෙ. නමුත් මේ අකුර තියෙන ෆොන්ට් එකක් නැහැ මම හිතන්නේ.

2010/4/2 ලලිත් මානගේ (Lalith Manage) <lalith...@gmail.com>
'විද්‍යාව' යන වචනයේ 'ද'යන්න සහ '්‍ය' (යංසය) බැඳි අකුරින් ලියන‍්නේ
කොහොම ද?

Sapumal Jayaratne

unread,
Apr 5, 2010, 3:15:06 AM4/5/10
to sinhala...@googlegroups.com
මෙය ඉතාමත් වැදගත් ප්‍රශ්ණයක්. 

විද්‍යෝදය වැනි වචනයකදී මෙය තවදුරටත් සංකීර්ණ වෙනවා. පෑලියගොඩ නවලෝක උද්‍යානයේ ද්‍යා යන අකුරත් ලියා තිබෙන්නේ ද යන්නේ පහල කොටසට යංසය බැඳී ඇති ආකාරයටයි.

මම මෙම ගැටළුව බොහෝ ඉහතදී පුද්ගලයන් රැසක් සමඟ සාකච්ඡා කලා. බොහෝ දෙනෙකුගේ අදහස වූයේ රෙන්ඩරින් කිරීමේ ක්‍රම දෙකක් ඇති විට එක් ක්‍රමයකට එනම් වඩා පහසු හා පැහැදිලි ක්‍රමය පමණක් භාවිතා කිරීම සෑහෙන බවයි. එනිසා මගේ දැනුමේ හැටියට දැනට තිබෙන රෙන්ඩරින් ඉංජින් වල මෙම අකුර ලිවීමේ හැකියාවක් නැහැ.

සැරදේවා,
සපුමල්.

2010/4/2 Chamila De Alwis <cs2re...@gmail.com>

Pahan Sarathchandra

unread,
Apr 5, 2010, 6:25:05 AM4/5/10
to sinhala...@googlegroups.com
වරද තිබෙන්නේ රෙන්ඩරින් එන්ජින් වල නෙවෙයි නිර්මාණය කරපු font වලයි. 
bhashitha font එකෙන් විද්‍යා ටයිප් කලාම යංසය එන්නේ 'ද' යන්නේ යට කොටසටයි. 
මෙන්න භාෂිත බාගත කරගන්න ලින්ක් එකකුත්

2010/4/5 Sapumal Jayaratne <sapumal....@gmail.com>



--
පහන්
Pahan Charithanga
http://www.pahans.com

Sapumal Jayaratne

unread,
Apr 5, 2010, 7:19:18 AM4/5/10
to sinhala...@googlegroups.com
ඔබ නිවැරදියි. මම භාෂිත අකුරු වැල ස්ථාපිත කරගෙන බැලුවා. විද්‍යාව, විද්‍යෝදය, උද්‍යානය වැනි වචන වල යංශය ද යන්නේ පහල කොටසටයි.

මෙම ක්‍රම දෙකෙන් කිසිවක් වැරදියි කියන්නට බැහැ. අවශ්‍යතාවය අනුව අකුරුවැල තෝරාගතහැකියි.

සැරදේවා,
සපුමල්.

2010/4/5 Pahan Sarathchandra <paha...@gmail.com>

ලලිත් මානගේ (Lalith Manage)

unread,
Apr 8, 2010, 4:14:26 PM4/8/10
to සිංහල යුනිකෝඩ් සමූහය - Sinhala Unicode Group
ප්‍රතිචාර දැක්වූ සැමට ස්තූතියි!
අන්තිමේ දී බැලුවහම Iskolapotha වැනි අතිශය බහුලව භාවිතා කරන අකුරු වැල්
වලට මේ බැඳි අකුරු එකතු කරලා යාවතත්කාලීන කරන්න ඕන. කවුද මේක කරන්නේ?

On Apr 5, 4:19 pm, Sapumal Jayaratne <sapumal.jayara...@gmail.com>
wrote:


> ඔබ නිවැරදියි. මම භාෂිත අකුරු වැල ස්ථාපිත කරගෙන බැලුවා. විද්‍යාව, විද්‍යෝදය,
> උද්‍යානය වැනි වචන වල යංශය ද යන්නේ පහල කොටසටයි.
>
> මෙම ක්‍රම දෙකෙන් කිසිවක් වැරදියි කියන්නට බැහැ. අවශ්‍යතාවය අනුව අකුරුවැල
> තෝරාගතහැකියි.
>
> සැරදේවා,
> සපුමල්.
>

> 2010/4/5 Pahan Sarathchandra <pahan...@gmail.com>


>
>
>
> > වරද තිබෙන්නේ රෙන්ඩරින් එන්ජින් වල නෙවෙයි නිර්මාණය කරපු font වලයි.
> > bhashitha font එකෙන් විද්‍යා ටයිප් කලාම යංසය එන්නේ 'ද' යන්නේ යට කොටසටයි.
> > මෙන්න භාෂිත බාගත කරගන්න ලින්ක් එකකුත්

> >http://www.sahithya.lk/downloads/<http://goog_2015522596>*bhashitha<http://goog_2015522596>
> > *.zip
>
> > 2010/4/5 Sapumal Jayaratne <sapumal.jayara...@gmail.com>


>
> >> මෙය ඉතාමත් වැදගත් ප්‍රශ්ණයක්.
>
> >> විද්‍යෝදය වැනි වචනයකදී මෙය තවදුරටත් සංකීර්ණ වෙනවා. පෑලියගොඩ නවලෝක
> >> උද්‍යානයේ ද්‍යා යන අකුරත් ලියා තිබෙන්නේ ද යන්නේ පහල කොටසට යංසය බැඳී ඇති
> >> ආකාරයටයි.
>
> >> මම මෙම ගැටළුව බොහෝ ඉහතදී පුද්ගලයන් රැසක් සමඟ සාකච්ඡා කලා. බොහෝ දෙනෙකුගේ
> >> අදහස වූයේ රෙන්ඩරින් කිරීමේ ක්‍රම දෙකක් ඇති විට එක් ක්‍රමයකට එනම් වඩා පහසු හා
> >> පැහැදිලි ක්‍රමය පමණක් භාවිතා කිරීම සෑහෙන බවයි. එනිසා මගේ දැනුමේ හැටියට දැනට
> >> තිබෙන රෙන්ඩරින් ඉංජින් වල මෙම අකුර ලිවීමේ හැකියාවක් නැහැ.
>
> >> සැරදේවා,
> >> සපුමල්.
>

> >> 2010/4/2 Chamila De Alwis <cs2resp...@gmail.com>


>
> >> පොතේ හැටියට "ද" + "‍\" + "යා" හෝ "ද" + "‍\" + "්‍යා" පිලිවෙලින් ඔය කියන
> >>> අකුර ලැබෙන්න ඕනෙ. නමුත් මේ අකුර තියෙන ෆොන්ට් එකක් නැහැ මම හිතන්නේ.
>

> >>>  2010/4/2 ලලිත් මානගේ (Lalith Manage) <lalithman...@gmail.com>


>
> >>>> 'විද්‍යාව' යන වචනයේ 'ද'යන්න සහ '්‍ය' (යංසය) බැඳි අකුරින් ලියන‍්නේ
>
> >>>> කොහොම ද?
>
> >>>> --
> >>>> සිංහල යුනිකෝඩ් සමූහය - Sinhala Unicode Group.
> >>>> මෙම සමූහයට විද්‍යුත් තැපැල් පණිවුඩයක් එවීමට:
> >>>> Sinhala...@googlegroups.com
> >>>> දායකත්වයෙන් ඉවත්වීමට මෙම ලිපිනයට ලියන්න:
> >>>> Sinhala-Unico...@googlegroups.com
> >>>> වෙනත් විකල්ප සඳහා සමූහය වෙත එන්න:
> >>>>http://groups.google.com/group/Sinhala-Unicode?hl=si
> >>>> If you have trouble reading Sinhala Fonts, please visit

> >>>>http://si.wikipedia.org/wiki/Wikipedia:Sinhala_fontfor instructions.


>
> >>>> To unsubscribe, reply using "remove me" as the subject.
>
> >>>  --
> >>> සිංහල යුනිකෝඩ් සමූහය - Sinhala Unicode Group.
> >>> මෙම සමූහයට විද්‍යුත් තැපැල් පණිවුඩයක් එවීමට:
> >>> Sinhala...@googlegroups.com
> >>> දායකත්වයෙන් ඉවත්වීමට මෙම ලිපිනයට ලියන්න:
> >>> Sinhala-Unico...@googlegroups.com
> >>> වෙනත් විකල්ප සඳහා සමූහය වෙත එන්න:
> >>>http://groups.google.com/group/Sinhala-Unicode?hl=si
> >>> If you have trouble reading Sinhala Fonts, please visit

> >>>http://si.wikipedia.org/wiki/Wikipedia:Sinhala_fontfor instructions.


>
> >>  --
> >> සිංහල යුනිකෝඩ් සමූහය - Sinhala Unicode Group.
> >> මෙම සමූහයට විද්‍යුත් තැපැල් පණිවුඩයක් එවීමට:
> >> Sinhala...@googlegroups.com
> >> දායකත්වයෙන් ඉවත්වීමට මෙම ලිපිනයට ලියන්න:
> >> Sinhala-Unico...@googlegroups.com
> >> වෙනත් විකල්ප සඳහා සමූහය වෙත එන්න:
> >>http://groups.google.com/group/Sinhala-Unicode?hl=si
> >> If you have trouble reading Sinhala Fonts, please visit

> >>http://si.wikipedia.org/wiki/Wikipedia:Sinhala_fontfor instructions.


>
> > --
> > පහන්
> > Pahan Charithanga
> >http://www.pahans.com
>
> >  --
> > සිංහල යුනිකෝඩ් සමූහය - Sinhala Unicode Group.
> > මෙම සමූහයට විද්‍යුත් තැපැල් පණිවුඩයක් එවීමට:
> > Sinhala...@googlegroups.com
> > දායකත්වයෙන් ඉවත්වීමට මෙම ලිපිනයට ලියන්න:
> > Sinhala-Unico...@googlegroups.com
> > වෙනත් විකල්ප සඳහා සමූහය වෙත එන්න:
> >http://groups.google.com/group/Sinhala-Unicode?hl=si
> > If you have trouble reading Sinhala Fonts, please visit

> >http://si.wikipedia.org/wiki/Wikipedia:Sinhala_fontfor instructions.

Pahan Sarathchandra

unread,
Apr 10, 2010, 4:11:47 AM4/10/10
to sinhala...@googlegroups.com

කරන එක නම් කරන්න පුලුවන්. ඒත් iskolepotha microsoft සමාගමට අයිති font එකක්. 
2010/4/9 ලලිත් මානගේ (Lalith Manage) <lalith...@gmail.com>

Sapumal Jayaratne

unread,
Apr 10, 2010, 9:45:28 AM4/10/10
to sinhala...@googlegroups.com
යංශය වෙනම ලියනවාද නැතිනම් බැඳලා ලියනවාද යන්න අකුරුවැල නිර්මාණය කරන්නාට තීරණය කල හැකියි. මේ ක්‍රම දෙකම අපි අතින් ලියද්දීත් භාවිතා කරනවා. එනිසා ඉස්කෝලේ පොතේ දැනට තිබෙන ක්‍රමයේ වරදක් නැහැ.

සැරදේවා,
සපුමල්.

2010/4/10 Pahan Sarathchandra <paha...@gmail.com>

ලලිත් මානගේ (Lalith Manage)

unread,
Apr 10, 2010, 12:35:54 PM4/10/10
to සිංහල යුනිකෝඩ් සමූහය - Sinhala Unicode Group
පහන්, ඉස්කෝලපොත හදලා මයික්‍රොසොෆ්ට් එකටම දෙන්න පුළුවන් නම් වැඩේ මරු.
පහන් මයික්‍රොසො‍ෆ්ට් එකට කතා කරන්න ද?
මේ යන්ස ප්‍රශ්නය විසඳා ඇති අකුරු ගොනු (font files) බාගත හැකි තැන්
මොනවද දන්වා ද?
සපුමල්, ඉස්කෝලපොතේ තියෙන්නේ වරදක් නෙවේ අඩුවක්. මේක ග්‍රැෆික් නිර්මාණ
කටයුතු වලදී සහ සිංහල බස පිළිබඳ සමහර දැ ප්‍රකාශනයේ දී බරපතල පැණයක්.

On Apr 10, 6:45 pm, Sapumal Jayaratne <sapumal.jayara...@gmail.com>
wrote:


> යංශය වෙනම ලියනවාද නැතිනම් බැඳලා ලියනවාද යන්න අකුරුවැල නිර්මාණය කරන්නාට තීරණය
> කල හැකියි. මේ ක්‍රම දෙකම අපි අතින් ලියද්දීත් භාවිතා කරනවා. එනිසා ඉස්කෝලේ
> පොතේ දැනට තිබෙන ක්‍රමයේ වරදක් නැහැ.
>
> සැරදේවා,
> සපුමල්.
>

> 2010/4/10 Pahan Sarathchandra <pahan...@gmail.com>


>
>
>
>
>
> > කරන එක නම් කරන්න පුලුවන්. ඒත් iskolepotha microsoft සමාගමට අයිති font
> > එකක්.

> > 2010/4/9 ලලිත් මානගේ (Lalith Manage) <lalithman...@gmail.com>

Pahan Sarathchandra

unread,
Apr 11, 2010, 6:16:34 AM4/11/10
to sinhala...@googlegroups.com


2010/4/10 ලලිත් මානගේ (Lalith Manage) <lalith...@gmail.com>

පහන්, ඉස්කෝලපොත හදලා මයික්‍රොසොෆ්ට් එකටම දෙන්න පුළුවන් නම් වැඩේ මරු.
පහන් මයික්‍රොසො‍ෆ්ට් එකට කතා කරන්න ද?

එහෙම නං දැනට තිබෙන  ද්‍ය වෙනස් කරන්න වෙනවා නේද.  ඒත් ඒකට කැමති අයත් ඉන්නවා නේද?. ‍
ඒක අලුත් font එකක් විදියට නිකුත් කරන්න පුළුවන් නම් හොඳයි.(ඉස්කොලෙ පොතේ අකුරු හැඩවල අඩුපාඩු තිබෙන බව මම අසා තිබෙනවා. ඒවාත් නිවැරදි කරන්නත් පුළුවන් නම් හොඳයි.) 
මේකෙ අවශ්‍යතාවය තදින්ම දැනෙනවා නම් මට font එක හදලා දෙන්න පුලුවන්. 

අපි qsfox  firefox ad-onනය සඳහා ඉස්කොලෙපොත යොදාගන්න උත්සහ කලත් ඒ අවස්තාවේ මුදල් ඉල්ලාසිටිය නිසා අපි ඒක අත්හැරියා. (දැන් මලිති ෆොන්ටය යොදාගන්නේ.). ඔබට මයික්‍රොසොෆ්ට් එක කතාකරලා qsfoxට මේ උදව්ව කරනවා නම් අගය කරනවා.( මේකෙන් කවුරුවත් සල්ලිහම්බ කරන්නෙ නැහැ.) 

වැදගත් :(qsfox develop කලේ මම නොවෙයි. මම අදහස දීලා පොඩි පොඩි උදව් කලා විතරයි.)
If you have trouble reading Sinhala Fonts, please visit http://si.wikipedia.org/wiki/Wikipedia:Sinhala_font for instructions.

දසුන් සමීර

unread,
Apr 14, 2010, 2:59:10 AM4/14/10
to සිංහල යුනිකෝඩ් සමූහය - Sinhala Unicode Group
මේ අකාරයේ විවිද ක්‍රමවලට ලියන අවසථා කීපයක්ම සිංහලේ තියෙනවා උදාහරණ්‍යක්
ලෙස කෲර යන වචනය පැරණි පොත්වල ක්‍රෑර ලෙස ලියා තියනවා. නමුත් මෙය වැරදි
භාවිතයක් නැවැරදි භාවිතාව දීර්ඝ ඇදය රකාරංශයට ලිවීමයි. නමුත් මුදෘණයේ
පහසුවට ක්‍රෑර ලෙසම අච්චු පොත් වල සටහන් කරා.(හේතුව රක්‍රරාංශයට වැටෙන
ලෙස වෙනම ඇදයක් අච්චුවක් ලෙස සකස්කිරීම කරදර නිසා.) ඒත් පසුව ෲ සංකේතය
භාවිතයට ආව නිසා ක්‍රැ යන අකුරු ඉංග්‍රිසි Crack යනවචනයේ ශබ්ධය වෙනුවටම
දැන් යුනිකේතයේ භාවිතා කරනවා.

ඉස්කොල පොත වගේම ගොඩක් සිංහල අකුරු වල වැරදි තියෙනවා උදාහරනයක් විදියට
ලඞකාව ලිවීමට භාවිතාරන ඞ අක්ෂරය ඇත්තටම ස්වරයක් නිරූපණය කරනවා. නමුත් එය
අඩංගු කර ඇත්තේ ගතකුරක් ලෙසයි. (මෙසේ කරන්නට ඇත්තේ අනෙකුත් ඉන්දික් අකුරු
සමග සමබර වීමට විය යුතුයි) නමුත් ඞි කියා අකුරක් සිංහලේ නෑ. නමුත් ඉස්කොල
පොත අකුරු වැලේ එහෙම එකක්තියනවා තියනවා. මලිත් අකුරු වැලේද වැරදි ලෙස
රෙන්ඩරින් වන අකුරු තිනෙවා. භාෂිත අකුරු වැලේ ඒ අතින් ඉදිරිනේ ඉන්නවා
(නමුත් අනවශ්‍ය ඞි ඞී වගේ අකුරුත ඒකෙත් තියෙනවා)

විද්‍යාව ප්‍රශ්ණය
රෙන්ඩරින් ක්‍රම එකකට වඩා තියෙනවිට එක විසඳුමක් තමයි. විවිද ෆොන්ට්
නිර්මාණය ඊට අමතරව එකම ෆොන්ට් එක භාවිතයෙන් වුනත් OpenType වල තියෙන
ෆීචර්ස් භාවිතා කර කැමති රෙන්ඩරින් ක්‍රමයක් ලැබෙන ලෙස සකස් කළ හැකියි.
උදාහරණයක් ලෙස පාලි අකුරු වල හල්කිරීම නෑ. හල්කිරීම ඇති සියලමු අකුරු
බැඳි ලෙස ලියන්න කිලා අපිට ස්ක්‍රිප්ට් එක සකස් කරන්න පුලුවන්. නමුත්
ගැටලුව ඇත්තේ බොහෝමයක් Application වල මේ පහසුකම් Implement වී
නොතිබීමයි. (Adobe Photoshop/ Illustrator වල හැර)

Chamila De Alwis

unread,
Apr 8, 2010, 11:18:12 PM4/8/10
to sinhala...@googlegroups.com
Iskole Potha ෆොන්ටය මයික්‍රෝසොෆ්ට් ආයතනයේ copyrighted ෆොන්ටයක්. ඒක නිසා ඒක වෙනස් කරන එක අපිට කරන්න බැහැ. නමුත් භාෂිත වගේ තවත් ෆොන්ට කිහිපයක් තියෙනවා GNU/GPL යටතේ බෙදා හැරපු. ඒවා වෙනස් කරන්න පුලුවන් ඒ license එකට අදාලව.

2010/4/9 ලලිත් මානගේ (Lalith Manage) <lalith...@gmail.com>

Kanchana Dinuka

unread,
Apr 14, 2010, 10:32:01 AM4/14/10
to sinhala...@googlegroups.com
ඔය ගැටලුව පිළිබඳ සිංහල වියතුන් විමසුවොත් මෙහි නිවැරදි ක්‍රමය පිළිබඳ
වියතුන් අදහස් දෙකක් දරයි කියලයි මට හිතෙන්නේ. පිරිසක් දැනට තිබෙන ක්‍රමය
නිවැරදි බවත් තවත් පිරිසක් වැරදි බවත් පවසනු ඇත. සපුමල් මහතා ඔබට මේ
පිළිබඳ අත්දැකීම් ඇති. මම මෙම ක්‍රම දෙකම අඩු වැඩි වශයෙන් භාවිතා වනු දැක
ඇත්තෙමි.

මට ෆොන්ට් පිළිබඳ තාක්‍ෂණික දැනුමක් මෙන්ම නිවැරදි ක්‍රමය කුමක්ද යන්න
ගැනත් නිවැරදි දැනීමක් නැහැ. නමුත් සියල්ලටම සතුටු විය හැක් එකඟතාවයකට
පැමිණිය හැකි නම් එය ඉතා අගේ යයි සිතමි. එම නිසා සාර්ථක විසඳුමක් ලෙස
"AltGr+h යන්නට දයන්නට පහලින් බැඳි යංසය ඇතුලත් කිරීමට" යෝජනා කරමි. එවිට
තම තමන්ට රුචිය අනුව ලිවිය හැක.

නමුත් මෙය සෙවුම් යන්ත්‍ර වලදී ගැටලුවක් වේ නම් මේ පිළිබඳ වියතුන්ගෙන්
සැදි කමිටුවක් පත් කොට වඩා නිවැරදි ක්‍රමය තෝරා ගැනීම මැනවි.

කාංචන දිනූක.

2010/4/5 Sapumal Jayaratne <sapumal....@gmail.com>:

> මම මෙම ගැටළුව බොහෝ ඉහතදී පුද්ගලයන් රැසක් සමඟ සාකච්ඡා කලා. බොහෝ දෙනෙකුගේ අදහස
> වූයේ රෙන්ඩරින් කිරීමේ ක්‍රම දෙකක් ඇති විට එක් ක්‍රමයකට එනම් වඩා පහසු හා
> පැහැදිලි ක්‍රමය පමණක් භාවිතා කිරීම සෑහෙන බවයි. එනිසා මගේ දැනුමේ හැටියට දැනට
> තිබෙන රෙන්ඩරින් ඉංජින් වල මෙම අකුර ලිවීමේ හැකියාවක් නැහැ.

Sapumal Jayaratne

unread,
Apr 29, 2010, 1:26:11 PM4/29/10
to sinhala...@googlegroups.com
සෙවුම් යන්ත්‍ර කිසිවක් දැනට සිංහල සඳහා සහාය නොදක්වයි. අපට සෙවුම් යන්ත්‍ර භාවිතයෙන් සිංහල සෙවුම් කල හැක්කේ ඒවායේ නිසඟයෙන් ම ඇති යුනිකේත පහසුකම නිසයි. සෙවුම් යන්ත්‍රයක් යම් බසක් සඳහා සහාය දක්වයිනම් සපුරාලිය යුතු පහසුකම් රාශියක් ඇත. සියල්ල පැවසීමට කාලවේලාව නොමැති වුවත් එක් උදාහරණයක් පමණක් දක්වමි. මේ සඳහා උනන්දුවක් ඇති අයට, විශේෂයෙන්ම සරසවි සිසුන්ට මෙම විශය ඔස්සේ දැනුම ගවේශණය කිරීමටත් පර්යේෂණ කිරීමටත් හැකිය. ඒ සඳහා යම් අයෙක් කැමැත්තක් දක්වයි නම් වැඩිදුර තොරතුරු ලබාදිය හැක.

lematization
සෙවුම් යන්ත්‍රයක පලමු පියවර වන්නේ තොරතුරු (වෙබ් පිටු, වර්ඩ් ගොනු, පීඩීඑෆ් ගොනු ආදිය) ඒකරාශී කරගෙන ඒවා ගබඩා කිරීමට සුදුසු ආකාරයකට සකසා ගැනීමයි. එලෙස සැකසීමේදී එය inverted index නමින් හඳුන්වට දත්ත සැකිල්ලක ගබඩා කිරීමට හැකි ආකාරයකට සකසා ගනී. එනම් යම් වෙබ් පිටුවක අඩංගු කරුණු වලට අදාල වචන ලැයිස්තුවක් සාදාගැනීම සිදුකරයි. උදාහරණයක් ලෙස fonts.lk අඩවිටයේ මුල් පිටුව සලකා බලමු. එහි බහුල වශයෙන් පහත සඳහන් වචන අඩංගු වේ.

සිංහල
භාෂා
යුනිකෝඩ්
...

මෙලෙස සාදාගත් ලැයිස්තුව කලින් සඳහන් කල දත්ත සැකිල්ලේ ගබඩා කරගනී. එහි මෙයට අමතරව තවත් වෙබ් පිටු මිලියන ගනනාවත තොරතුරු අඩංගු වී තිබිය හැක.

දැන් යම් කිසිවෙක් යුකිතෝඩ් යන වඩනය සොයන්නේ නම් එම වචනය අඩංගු වෙබ් පිටු ගනනාවක් සෙවුම් යන්ත්‍රයට සොයාගත හැක. නමුත් කිසිවෙක් යුනිකේත යන වචනය සෙවුවොත් කුමක් වේද? ඉහත වෙබ් පිටුව අපට හමු නොවේ. එනිසා සෙවුම් යන්ත්‍ර අදාල වචන ලැයිස්තුව සැකසීමේදී සමාන යෙදුම් ද සැලකිල්ලට ගනී. එනම් ඉහත වෙබ් පිටුවේ යුනිකේත යන වචනය ඇති බව ද සටහන් කරගනී. මෙම ක්‍රියාවලිය lematization ලෙස හඳුන්වයි.

lematization ක්‍රම දෙකකට සිදුකල හැකිය. ඉහත සඳහන් කලේ එක් ක්‍රමයකි. තවත් ක්‍රමයක් නම් යම් කෙනෙක් යුනිකේත යන්න සොයන්නේ නම් එයට සමාන වචන සොයා එවා අඩංගු වෙබ් පිටුත් ප්‍රතිථල වලට එකතු කිරීමයි.

සැරදේවා,
සපුමල්.

2010/4/14 Kanchana Dinuka <kanchan...@gmail.com>
Reply all
Reply to author
Forward
0 new messages