ตอนนี้ทาง "โครงการคลังข้อมูลภาษาไทยแห่งชาติ" (Thai National Corpus)
กำลังรวบรวมตัวอย่างข้อความภาษาไทย ให้ได้ครบ 80 ล้านคำอยู่
ถ้าเกิดว่าทางเจ้าของลิขสิทธิ์/สำนักพิมพ์ ที่ดูแลเรื่อง
สถาบันสถาปนา/นิยายวิทยาศาสตร์/หนังสืออื่นๆ
สนใจจะส่งบางส่วนของเรื่อง (ไม่เกิน 40,000 คำ) เข้าร่วมเป็นส่วนหนึ่งของคลัง
ก็สามารถส่งได้ที่
http://www.arts.chula.ac.th/~ling/TNC/YourContributions.html
ดูรายละเอียดโครงการได้ที่นี่ครับ
http://www.arts.chula.ac.th/~ling/TNC/
ผมเขียนอธิบายไว้นิดหน่อยที่นี่
http://bact.blogspot.com/2007/10/thai-national-corpus-project.html
โครงการนี้ดูแลโดย ภาควิชาภาษาศาสตร์ คณะอักษรศาสตร์ จุฬาฯ
คลังข้อความที่ได้จากโครงการนี้ จะเป็นสมบัติสาธารณะครับ
ขอบคุณครับ
อาทิตย์
--
:: Freedom Against Censorship Thailand
:: http://facthai.wordpress.com/sign/