Alibaba’s QwQ-32B AI Model Surges Ahead: A Landmark in Reinforcement Learning
AI Model ของ Alibaba เอาชนะ OpenAI's o1-mini ประสิทธิภาพเทียบเท่า DeepSeek R1
AI Model ของ Alibaba เอาชนะ OpenAI's o1-mini ประสิทธิภาพเทียบเท่า DeepSeek R1
Alibaba Cloud เปิดตัวโมเดล AI ใหม่ที่สามารถเทียบเท่ากับคู่แข่งที่ใหญ่กว่าได้แม้จะมีขนาดเล็กกว่ามาก โมเดลนี้เรียกว่า QwQ-32B ซึ่งถือเป็นความก้าวหน้าที่อาจเปลี่ยนแปลงทิศทางของวงการ AI ได้ QwQ-32B ถูกพัฒนาบนพื้นฐานของ Qwen2.5-32B ของ Alibaba และใช้เพียง 32.5 พันล้านพารามิเตอร์ เมื่อเปรียบเทียบกับ DeepSeek R1 ที่มีพารามิเตอร์ถึง 671 พันล้าน แม้จะมีขนาดไม่ใหญ่เท่ากับ DeepSeek R1 แต่ QwQ-32B สามารถสร้างประสิทธิภาพที่เทียบเท่ากันได้
ทีมงานของ Qwen กล่าวในบล็อกโพสต์ว่า "This remarkable outcome underscores the effectiveness of RL when applied to robust foundation models pretrained on extensive world knowledge." ซึ่งชี้ให้เห็นถึงประสิทธิภาพของการฝึก Reinforcement Learning (RL) บนโมเดลแบบพื้นฐาน อ้างอิงจากผลการทดสอบภายใน QwQ-32B ทำคะแนนได้ 65.2% ในการทดสอบ GPQA, 50% ในการทดสอบ AIME และ 90.6% ในการทดสอบ MATH-500
ทั้งนี้ AI community ได้แสดงความชื่นชมผลงานของ Alibaba เช่น Vaibhav Srivastav นักวิจัย AI กล่าวว่า “Absolutely love it!” ในขณะที่ Julien Chaumond CTO ของ Huggin Face กล่าวว่าการสร้างโมเดลนี้ "changes everything" โมเดล QwQ-32B มีประสิทธิภาพสูงในงานประเภทการคำนวนคณิตศาสตร์และการเขียนโปรแกรม โครงสร้างการฝึกที่ประสบความสำเร็จนี้เกิดขึ้นเพื่อแสดงว่าไม่จำเป็นต้องมีจำนวนพารามิเตอร์ที่มากมายเพื่อให้ได้ประสิทธิภาพที่สูง
ถึงแม้ว่า QwQ-32B จะมีความก้าวหน้าแค่ไหน โครงสร้างด้านกฎระเบียบในประเทศจีนยังคงมีผลต่อการตอบสนองในประเด็นอ่อนไหวทางการเมืองบางประการ และมี context window ที่จำกัดอยู่ที่ 32K token นอกจากนั้น ที่น่าสนใจคือ Alibaba ได้ประกาศให้โมเดลนี้ออกมาในรูปแบบ open-source ภายใต้ Apache 2.0 license
ในด้านของตลาดหุ้น QwQ-32B ไม่ได้มีผลกระทบต่อผู้ลงทุนเช่นเดียวกับตอน DeepSeek R1 ออกมาที่ส่งผลกระทบอย่างมากต่อตลาด
Alibaba กล่าวว่า "This marks Qwen's initial step in scaling Reinforcement Learning to enhance reasoning capabilities," บริษัทมองว่านี่เป็นเพียงจุดเริ่มต้นในการเดินทางสู่การพัฒนา Artificial General Intelligence (AGI) ให้สำเร็จ
Source: https://decrypt.co/309022/alibabas-latest-ai-model-beats-openais-o1-mini-on-par-with-deepseek-r1
Tags: #AvareumNews #AI #Alibaba #OpenAI #DeepSeekR1 #Technology
This newsletter is produced with assistance from OpenAI's ChatGPT-4. All analyses are reviewed and verified by our research team.