breaking-news-2

Alibaba’s QwQ-32B AI Model Surges Ahead: A Landmark in Reinforcement Learning

by Avareum Research

Updated March 07, 2025

AI Model ของ Alibaba เอาชนะ OpenAI's o1-mini ประสิทธิภาพเทียบเท่า DeepSeek R1

Alibaba Cloud เปิดตัวโมเดล AI ใหม่ที่สามารถเทียบเท่ากับคู่แข่งที่ใหญ่กว่าได้แม้จะมีขนาดเล็กกว่ามาก โมเดลนี้เรียกว่า QwQ-32B ซึ่งถือเป็นความก้าวหน้าที่อาจเปลี่ยนแปลงทิศทางของวงการ AI ได้ QwQ-32B ถูกพัฒนาบนพื้นฐานของ Qwen2.5-32B ของ Alibaba และใช้เพียง 32.5 พันล้านพารามิเตอร์ เมื่อเปรียบเทียบกับ DeepSeek R1 ที่มีพารามิเตอร์ถึง 671 พันล้าน แม้จะมีขนาดไม่ใหญ่เท่ากับ DeepSeek R1 แต่ QwQ-32B สามารถสร้างประสิทธิภาพที่เทียบเท่ากันได้

ทีมงานของ Qwen กล่าวในบล็อกโพสต์ว่า "This remarkable outcome underscores the effectiveness of RL when applied to robust foundation models pretrained on extensive world knowledge." ซึ่งชี้ให้เห็นถึงประสิทธิภาพของการฝึก Reinforcement Learning (RL) บนโมเดลแบบพื้นฐาน อ้างอิงจากผลการทดสอบภายใน QwQ-32B ทำคะแนนได้ 65.2% ในการทดสอบ GPQA, 50% ในการทดสอบ AIME และ 90.6% ในการทดสอบ MATH-500

ทั้งนี้ AI community ได้แสดงความชื่นชมผลงานของ Alibaba เช่น Vaibhav Srivastav นักวิจัย AI กล่าวว่า “Absolutely love it!” ในขณะที่ Julien Chaumond CTO ของ Huggin Face กล่าวว่าการสร้างโมเดลนี้ "changes everything" โมเดล QwQ-32B มีประสิทธิภาพสูงในงานประเภทการคำนวนคณิตศาสตร์และการเขียนโปรแกรม โครงสร้างการฝึกที่ประสบความสำเร็จนี้เกิดขึ้นเพื่อแสดงว่าไม่จำเป็นต้องมีจำนวนพารามิเตอร์ที่มากมายเพื่อให้ได้ประสิทธิภาพที่สูง

ถึงแม้ว่า QwQ-32B จะมีความก้าวหน้าแค่ไหน โครงสร้างด้านกฎระเบียบในประเทศจีนยังคงมีผลต่อการตอบสนองในประเด็นอ่อนไหวทางการเมืองบางประการ และมี context window ที่จำกัดอยู่ที่ 32K token นอกจากนั้น ที่น่าสนใจคือ Alibaba ได้ประกาศให้โมเดลนี้ออกมาในรูปแบบ open-source ภายใต้ Apache 2.0 license

ในด้านของตลาดหุ้น QwQ-32B ไม่ได้มีผลกระทบต่อผู้ลงทุนเช่นเดียวกับตอน DeepSeek R1 ออกมาที่ส่งผลกระทบอย่างมากต่อตลาด

Alibaba กล่าวว่า "This marks Qwen's initial step in scaling Reinforcement Learning to enhance reasoning capabilities," บริษัทมองว่านี่เป็นเพียงจุดเริ่มต้นในการเดินทางสู่การพัฒนา Artificial General Intelligence (AGI) ให้สำเร็จ

Source: https://decrypt.co/309022/alibabas-latest-ai-model-beats-openais-o1-mini-on-par-with-deepseek-r1

Tags: #AvareumNews #AI #Alibaba #OpenAI #DeepSeekR1 #Technology

This newsletter is produced with assistance from OpenAI's ChatGPT-4. All analyses are reviewed and verified by our research team.

by Avareum Research

Updated March 07, 2025

Subscribe to Our Newsletter

Alibaba’s QwQ-32B AI Model Surges Ahead: A Landmark in Reinforcement Learning

AI Model ของ Alibaba เอาชนะ OpenAI's o1-mini ประสิทธิภาพเทียบเท่า DeepSeek R1

Read More

Nintendo Switch 2: ขนาดที่ใหญ่ขึ้นเป็นปัญหาหรือเปล่า?

Joe Exotic เปิดตัวเหรียญ EXOTIC ทาง Solana จากเรือนจำ

Dogecoin Mining Takes Center Stage at Major Conference

GameStop's Crypto Strategy and Global Inflations Impact Bitcoin's Volatility