"ไต้ฝุ่น 2" เวอร์ชั่นใหม่ล่าสุดได้รับการออกแบบให้มีความสามารถตอบสนองต่อการใช้งานได้หลากหลายมากยิ่งขึ้น โดยมีขนาดโมเดลเพิ่มขึ้นถึง 5 ขนาด (1B, 3B, 7B, 8B และ 70B) ด้วยคุณสมบัติใหม่ที่โดดเด่น (Key Features) ได้แก่
- เพิ่มประสิทธิภาพและความแม่นยำของภาษาไทยที่สูงขึ้น ประเมินจากเกณฑ์มาตรฐาน เช่น ThaiExam และ M3Exam ซึ่งมีการประมวลผลภาษาไทยที่เหนือกว่าโมเดล Open source อื่นๆ
- ปรับปรุงประสิทธิภาพการทำตามคำสั่งที่ดีขึ้น เมื่อเทียบกับ Typhoon 1.0 - Typhoon 1.5X โดยประเมินจากมาตรฐาน IFEval-TH และ MT-Bench
- รับข้อมูล และGenerate Text ได้มากขึ้น โดยขยายความยาว Context จาก 8,192 เป็น 128,000 Tokens ช่วยให้สามารถทำงานกับข้อมูลที่ซับซ้อนได้มากขึ้น
- เพิ่มความสามารถในการเรียกใช้งานฟังก์ชัน (Function Calling) ที่ดีที่สุดในระดับ SOTA (State-of-the-Art)
- มีโมเดลขนาดเล็กที่รองรับการทำงานบนอุปกรณ์พกพา สำหรับงานที่ไม่ซับซ้อน เช่น การสรุปข้อมูลและแปลภาษา
- มี Safety Classifier Model (Preview) ที่ถูกปรับแต่งเพื่อบริบทภาษาไทย ช่วยพิจารณาความเหมาะสมของคำที่ป้อนเข้าไป หากพบว่าไม่เหมาะสมก็จะแจ้งเตือน
นอกเหนือจากนี้ได้มีการพัฒนา โมเดล Multimodal ซึ่งรองรับการประมวลผลทั้งข้อความ เสียง และภาพอย่างครบถ้วน เพื่อเปิดโอกาสใหม่ในการใช้งานในหลายบริบทและยกระดับประสิทธิภาพของ "ไต้ฝุ่น 2" โดยมีสองโมเดลสำคัญ ได้แก่
- Typhoon2-Audio (Research Preview)
- รองรับการทำงานร่วมกันของข้อมูลเสียงและข้อความ: สามารถรับ Input และสร้าง Output ได้ทั้งสองรูปแบบในเวลาเดียวกัน เพื่อให้การโต้ตอบเป็นธรรมชาติและราบรื่นยิ่งขึ้น
- มีความสามารถในการวิเคราะห์เสียงอย่างลึกซึ้ง: สามารถเข้าใจเนื้อหาและแยกแยะอารมณ์ในเสียงได้
- เพิ่มประสิทธิภาพในการประมวลผลคำสั่งที่ซับซ้อน: รองรับการโต้ตอบที่ต้องการความละเอียดและการดำเนินการหลายขั้นตอน
- พัฒนาฟังก์ชัน Text-to-Speech: เปลี่ยนข้อความเป็นเสียงภาษาไทยด้วยคุณภาพที่เหนือกว่าโมเดล Open Source อื่นๆ
- Typhoon2-Vision (Research Preview)
- เสริมศักยภาพในการประมวลผลและเข้าใจภาพ: รองรับการวิเคราะห์ภาพอย่างละเอียดและทำความเข้าใจเนื้อหาได้ครบถ้วน
- มีฟังก์ชัน OCR (Optical Character Recognition) ในตัว: แปลงข้อความจากภาพหรือเอกสารให้อยู่ในรูปแบบดิจิทัลได้อย่างแม่นยำ เหมาะสำหรับการจัดการข้อมูลในงานหลากหลายประเภท
**คำชี้แจงสำคัญ (Disclaimer) โมเดล Typhoon2-Audio และ Typhoon2-Vision ถูกพัฒนาขึ้น และสามารถทดลองใช้งานหรือประยุกต์ใช้ร่วมกับ Application ในรูปแบบต่างๆ ได้อย่างหลากหลาย อย่างไรก็ตาม เนื่องจากปัจจุบัน ยังอยู่ในขั้นตอนพัฒนาและทดลองวิจัย จึงอาจจะยังไม่เหมาะกับการนำไปใช้งานในเชิงพาณิชย์อย่างเต็มรูปแบบ
"ไต้ฝุ่น 2" ได้รับการสนับสนุนจากพันธมิตรชั้นนำทั้งในไทยและต่างประเทศ ได้แก่ VISTEC, มหาวิทยาลัยมหิดล, Artificial Intelligence Association of Thailand (AIAT), AI Singapore (AISG), Stanford Human-Centered Artificial Intelligence (Stanford HAI), Together AI, SEA AI Lab, InnovestX, Sambanova Systems เพื่อร่วมกันผลักดันการประยุกต์ใช้โมเดลภาษาไทยขนาดใหญ่ให้เกิดขึ้นในหลากหลายอุตสาหกรรม
สำหรับผู้ที่สนใจเข้าร่วมงาน "Typhoon 2 Unveiled: Advancing AI Research in Thailand" สามารถลงทะเบียนได้ที่ https://lu.ma/droty4z9 หรือติดตามข้อมูลเกี่ยวกับ "ไต้ฝุ่น 2" และร่วมทดลองใช้งานโมเดลภาษาไทยขนาดใหญ่ เวอร์ชั่นใหม่ล่าสุด ได้ที่ https://opentyphoon.ai/
ที่มา: เอสซีบี เท็นเอกซ์