รายละเอียด 3 งานวิจัยของ DataX
- "Birbal: An efficient 7B instruct-model fine-tuned with curated datasets" จากงาน Data-centric Machine Learning Research (DMLR) Workshop at ICLR 2024 จัดขึ้น ณ กรุงเวียนนา ประเทศออสเตรีย โดยงานวิจัยนำเสนอผลจากนำโมเดลชนะเลิศชื่อ Birbal ซึ่งใช้เทคโนโลยี Mistral-7B และถูกปรับปรุงด้วยการฝึกเพิ่มเติมบนเครื่อง RTX 4090 เพียงเครื่องเดียวเป็นเวลา 16 ชั่วโมง โดยได้รับการปรับปรุงผลลัพธ์ไปถึง 35% มากกว่าการส่งผลงานที่ดีที่สุดอีกอันที่มีชื่อว่า Qwen-14B ด้วยการสร้างคำสั่งที่มีคุณภาพสูงที่สามารถครอบคลุมงานที่หลากหลาย โดยมี นายปาวัน ราชปุต Senior AI Scientist DataX เป็นผู้เขียนร่วมคนที่สอง
- https://dmlr.ai/
- "Team NP_PROBLEM at SemEval-2024 Task 7: Numerical Reasoning in Headline Generation with Preference Optimization" จากงาน International Workshop on Semantic Evaluation (SemEval-2024) จัดขึ้น ณ กรุงเม็กซิโกซิตี้ ประเทศเม็กซิโก โดยงานวิจัยนำเสนอการวิเคราะห์ตัวเลข ซึ่งมีความแม่นยำทางตัวเลขสูงสุดกว่า 73.49% และได้เลือกการออกแบบระบบและรูปแบบข้อผิดพลาดที่พบบ่อย ตอกย้ำถึงศักยภาพและความท้าทายในการผสมผสานการวิเคราะห์ตัวเลขในการสร้างหัวข้อข่าวของ LLM โดยมี นายปาวัน ราชปุต และนายณัฎฐ์ ชูกำแพง Senior AI Scientist DataX เป็นผู้ร่วมเขียนงานวิจัย
- https://sites.google.com/view/numeval/numeval
- "Adapting LLM to Multi-lingual ESG Impact and Length Prediction using In-context Learning and Fine-Tuning with Rationale" จากงาน Financial Technology and Natural Language Processing (FinNLP), COLING 2024 โดยงานวิจัยนำเสนอวิธีการทำนายผลกระทบและระยะเวลาของผลกระทบทางสิ่งแวดล้อม เชิงสังคม และการบริหารงาน (ESG) จากบทความข่าวโดยใช้ LLMs รวมถึง GPT-4 พร้อมกับ In-context learning (ICL) และ Mistral (7B) LLM โดยมี นายปาวัน ราชปุต Senior AI Scientist DataX เป็นผู้เขียนหลัก
- https://sites.google.com/nlg.csie.ntu.edu.tw/finnlp-kdf-2024/accepted-papers
ที่มา: เอสซีบี เดต้า เอกซ์