วันจันทร์ที่ 14 มกราคม พ.ศ. 2556

พจนานุกรมสื่ออิเล็กทรอนิกส์ไทย อังกฤษ LEXiTRON


Welcome to LEXiTRON

พจนานุกรมสื่ออิเล็กทรอนิกส์ไทย <-> อังกฤษ LEXiTRON เวอร์ชัน 2009 beta สร้างปรากฏการณ์ทางเลือกใหม่ในการช่วยชาวไทยและชาว ต่างประเทศศึกษา ค้นคว้าและเรียนรู้ภาษาไทยควบคู่ไปกับภาษาอังกฤษ โดยท่านสามารถค้นหาคำศัพท์และข้อมูลต่างๆ ของคำศัพท์ ภาษาไทยและภาษาอังกฤษที่ต้องการได้อย่างรวดเร็วทันใจด้วยช่องรับข้อมูล input boxในหน้า Homepage โดยไม่เสียค่าใช้จ่ายใดๆ ทั้งสิ้น นอกจากนี้สมาชิกยังสามารถ Download ฟรี! ทั้งโปรแกรมและข้อมูลไปติดตั้งบนเครื่องคอมพิวเตอร์ของท่าน เพื่อใช้งาน LEXiTRON ได้โดยไม่ต้องผ่านอินเทอร์เน็ตข้อตกลงการอนุญาตใช้สิทธิ์ (LICENSE AGREEMENT)แล้วยังได้เพลิดเพลินกับความรู้และสาระบันเทิงที่นำเสนอบนเว็บไซต์ ดังต่อไปนี้


เกี่ยวกับเล็กซิตรอน ให้ข้อมูลที่คุณอยากทราบเกี่ยวกับการพัฒนา LEXiTRON
ระบบแนะนำคำศัพท์ เชิญทุกท่านร่วมขยายคลังคำศัพท์ในพจนานุกรมด้วยการแนะนำ คำศัพท์ ใหม่ ทันสมัย ที่ท่านเห็นว่าสมควรปรากฏใน LEXiTRON และกรุณาให้ข้อมูลเกี่ยวกับตัว ท่านเพื่อได้รับข่าวสาร ข้อมูลความเคลื่อนไหวและกิจกรรมของ LEXiTRON ในโอกาสต่อไป เกมส์ สนุกสนานเพลิดเพลินและเสริมทักษะการเรียนรู้ภาษาไปกับเกมคำศัพท์ภาษาไทยและภาษาอังกฤษ คำถามที่พบบ่อย คำถามที่ถามบ่อย หากต้องการส่งคำถามหรือเสนอความคิดเห็น เชิญส่งมาที่ lexitron@nectec.or.th หรือ lexitron@links.nectec.or.th 

 เกี่ยวกับเล็กซิตรอน พจนานุกรมสื่ออิเล็กทรอนิกส์ไทย <-> อังกฤษ LEXiTRON เวอร์ชัน 3.0beta จัดทำโดยหน่วยปฏิบัติการวิจัยวิทยาการมนุษยภาษา ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ เป็นงานพัฒนาต่อเนื่องจาก เวอร์ชัน 2.6 ซึ่งเพิ่มเติมฐานข้อมูลจากเดิมที่มีอยู่ให้เป็นคลังข้อความพจนานุกรมที่มีขนาดใหญ่ หลักการสำคัญของการพัฒนา LEXiTRON คือ การนำเทคโนโลยีฐานข้อมูลขนาดใหญ่เข้ามาช่วยในการวิจัยและพัฒนาในสาขาการประมวลผล ภาษาธรรมชาติ เรียกว่า การสร้างพจนานุกรมจากฐานข้อมูลขนาดใหญ่ (Corpus-Based Dictionary)

วิธีการสร้างฐานข้อมูลขนาดใหญ่ (Corpus) เป็นการใช้เทคโนโลยีทางคอมพิวเตอร์รวบรวมและคัดเลือกคำ ประโยค หรือข้อความ ที่มีใช้จริงและมีอัตราการปรากฏสูงในบริบทต่างๆ ของการใช้ภาษา จากแหล่งข้อมูลและข่าวสารที่เผยแพร่ทางอินเทอร์เน็ตและแหล่งข้อมูลอื่นๆ ที่เชื่อถือได้ เช่น วรรณกรรม บทความ เอกสารทางวิชาการ ข้อมูลข่าวสารจากหนังสือพิมพ์ เป็นต้น

ลักษณะเด่น แสดงความหมายและประเภทของคำพร้อมทั้งประโยคตัวอย่างที่มีใช้จริงและมีอัตราการปรากฏ สูงในบริบทต่างๆ ของการใช้ภาษา

องค์ประกอบของการพัฒนา
1. ฐานข้อมูลพจนานุกรม
1.1 อังกฤษ-ไทย (79,000 คำ) ประกอบด้วย คำศัพท์ภาษาอังกฤษ คำแปลภาษาไทย คำอ่าน คำหลัก คำค้นหา คำพ้องและคำตรงข้ามความหมายภาษาไทย คำพ้องและคำตรงข้ามความหมายภาษาอังกฤษ และตัวอย่างประโยคภาษาอังกฤษที่อ้างอิงจากคลังข้อความขนาดใหญ่ (Corpus-Based Sentence)
1.2 ไทย-อังกฤษ (51,000 คำ) ประกอบด้วย คำศัพท์ภาษาไทย คำแปลภาษาอังกฤษ คำพ้อง ความหมายภาษาไทย คำตรงข้ามความหมายภาษาไทย คำนิยามศัพท์ คำลักษณนาม และตัวอย่างประโยค ภาษาไทย

2. การพัฒนาโปรแกรม
2.1 คลังข้อมูลประโยค คือ Orchid Corpus ที่พัฒนาโดย ฝ่ายวิจัยและพัฒนาสาขาสารสนเทศ
2.2 โปรแกรมสำหรับการพัฒนาคือ J builder และ Apache

Acknowledgements
1. เสียงภาษาอังกฤษ สร้างจาก Microsoft Concatenative Speech Synthesis Engine
2. เสียงภาษาไทย สร้างจาก Vaja Text-to-Speech Engine พัฒนาโดย RDI, NECTEC

แหล่งที่มา: http://lexitron.nectec.or.th

DawnLoad

ไม่มีความคิดเห็น:

แสดงความคิดเห็น

หมายเหตุ: มีเพียงสมาชิกของบล็อกนี้เท่านั้นที่สามารถแสดงความคิดเห็น