my-thai-utils (MySQL User-Defined Functions (UDF) for Thai language processing)

64 views
Skip to first unread message

Thawatchai Piyawat

unread,
Oct 19, 2009, 7:51:52 PM10/19/09
to thai-linux...@googlegroups.com, thai...@googlegroups.com
สวัสดีครับ

ผมพึ่งทำ my-thai-utils เสร็จ ซึ่งเป็น User-Defined Function (UDF) library สำหรับ MySQL โดยตอนนี้มีหนึ่งฟังก์ชั่นคือ THAI_SPACE_SPLIT() เพื่อแยกคำภาษาไทยส่งให้ full-text search engine อาทิเช่น Sphinx หรือ Zebra ครับ หากใครพบว่าซอฟต์แวร์นี้มีประโยชน์จะนำไปใช้หรือสนใจจะร่วมพัฒนาผมก็ยินดีครับ ซอฟต์แวร์นี้ใช้ GPL v2 ครับ

สามารถดูรายละเอียดเพิ่มเติมได้ที่ http://code.google.com/p/my-thai-utils/

ขอบคุณครับ

ธวัชชัย ปิยะวัฒน์

Dome Charoenyost

unread,
Oct 19, 2009, 11:55:42 PM10/19/09
to thai-linux...@googlegroups.com
UDF ของ Mysql นี่เอามา select แบบ full-text ตรงๆ ได้ไหมครับ ?

เมื่อ ตุลาคม 20, 2009 6:51 ก่อนเที่ยง, Thawatchai Piyawat
<thawa...@gmail.com> เขียนว่า:

Thawatchai Piyawat

unread,
Oct 20, 2009, 12:06:51 AM10/20/09
to thai-linux...@googlegroups.com
UDF เพียงแค่เพิ่มฟังก์ชั่นใน MySQL ครับ แต่ไม่ได้เป็นการช่วยให้ full-text indexer สามารถจัดการกับภาษาไทยได้ครับ แต่ MySQL มีวิธีการเขียน full-text parser เพิ่มเข้าไปได้ครับ ผมตั้งใจว่าจะหาโอกาสทำอยู่เหมือนกันครับ

ธวัชชัย



2009/10/20 Dome Charoenyost <do...@tel.co.th>

Arthit Suriyawongkul

unread,
Oct 20, 2009, 12:13:23 AM10/20/09
to thai-linux...@googlegroups.com
ขอบคุณมากครับ
เดี๋ยวต้องลองดูหน่อย

อาท

Pattara Kiatisevi (list)

unread,
Oct 20, 2009, 12:17:10 AM10/20/09
to thai-linux...@googlegroups.com
ถ้าสมมติเรามี column name แล้วเราสร้างอีก column อัน เช่น name_split แล้วใช้ UDF
นี้สร้าง content ให้ name_split จาก name (กล่าวคือ มันคือเนื้อหาตาม name
แต่มีตัดคำไทย) แล้วทำ full text index บน column name_split นี่มันจะ work ไหมครับ

Ott

Thawatchai Piyawat wrote:
> UDF เพียงแค่เพิ่มฟังก์ชั่นใน MySQL ครับ แต่ไม่ได้เป็นการช่วยให้ full-text indexer
> สามารถจัดการกับภาษาไทยได้ครับ แต่ MySQL มีวิธีการเขียน full-text parser
> เพิ่มเข้าไปได้ครับ ผมตั้งใจว่าจะหาโอกาสทำอยู่เหมือนกันครับ
>
> ธวัชชัย
>
>
>

> 2009/10/20 Dome Charoenyost <do...@tel.co.th <mailto:do...@tel.co.th>>


>
> UDF ของ Mysql นี่เอามา select แบบ full-text ตรงๆ ได้ไหมครับ ?
>
> เมื่อ ตุลาคม 20, 2009 6:51 ก่อนเที่ยง, Thawatchai Piyawat

> <thawa...@gmail.com <mailto:thawa...@gmail.com>> เขียนว่า:

Thawatchai Piyawat

unread,
Oct 20, 2009, 12:47:17 AM10/20/09
to thai-linux...@googlegroups.com
ผมคิดว่าได้เลยครับ การเก็บอย่างนั้นแม้เป็นการเก็บข้อมูลซ้ำซ้อน แต่ disk space เดี๋ยวนี้ไม่ใช่ปัญหาอีกต่อไป column name_split ถือว่าเป็นส่วนหนึ่งของ full-text indexes ของเราเอง และด้วยวิธีนี้ก็เรียกได้ว่าเราได้ full-text search ภาษาไทยด้วย MySQL แล้วครับ

ธวัชชัย


2009/10/20 Pattara Kiatisevi (list) <pattar...@mm.co.th>

Dome Charoenyost

unread,
Oct 20, 2009, 12:52:53 AM10/20/09
to thai-linux...@googlegroups.com
เมื่อ ตุลาคม 20, 2009 11:47 ก่อนเที่ยง, Thawatchai Piyawat
<thawa...@gmail.com> เขียนว่า:

> ผมคิดว่าได้เลยครับ การเก็บอย่างนั้นแม้เป็นการเก็บข้อมูลซ้ำซ้อน แต่ disk
> space เดี๋ยวนี้ไม่ใช่ปัญหาอีกต่อไป column name_split ถือว่าเป็นส่วนหนึ่งของ
> full-text indexes ของเราเอง และด้วยวิธีนี้ก็เรียกได้ว่าเราได้ full-text
> search ภาษาไทยด้วย MySQL แล้วครับ
>

น่าสนใจครับ ใครลองแล้วแจ้งผลให้ทราบหน่อยนะครับ
ถ้ามีเวลาลองผมก็จะแจ้งผลให้ทราบครับ

โดม

Reply all
Reply to author
Forward
0 new messages