هوش مصنوعی

رونمایی از هوش مصنوعی جدید شرکت علی بابا به نام Qwen3

مدل‌های هوش مصنوعی Qwen3 از شرکت علی‌بابا با استفاده از ۶۰۰ میلیون تا ۲۳۵ میلیارد پارامتر، عملکرد چشمگیری نسبت به رقبا از خود نشان می‌دهند.

شرکت چینی علی‌بابا از سری جدید مدل‌های هوش مصنوعی خود با نام Qwen3 رونمایی کرده است. به گفته‌ی این غول فناوری، مدل‌های جدید در برخی از آزمایش‌ها توانسته‌اند عملکردی مشابه یا حتی بهتر از مدل‌های پیشرفته‌ی گوگل و OpenAI داشته باشند. این مدل‌ها از ۶۰۰ میلیون تا ۲۳۵ میلیارد پارامتر بهره می‌برند و بسیاری از آنها به‌صورت متن‌باز در پلتفرم‌هایی همچون گیت‌هاب و Hugging Face در دسترس قرار گرفته‌اند یا به‌زودی در دسترس خواهند بود.

بنچمارک مدل هوش مصنوعی علی بابا Qwen3

Qwenlm

مدل‌های Qwen3 به‌صورت “ترکیبی” طراحی شده‌اند، بدین معنا که می‌توانند بسته به نوع وظیفه، با صرف زمان بیشتر مسائل پیچیده را حل کنند یا به‌سرعت به درخواست‌های ساده پاسخ دهند. این رویکرد مشابه توانایی‌های مدل‌های OpenAI همچون o3 است و امکان تنظیم بهینه‌ی بودجه‌ی پردازشی برای هر وظیفه را فراهم می‌کند.

بنچمارک مدل هوش مصنوعی علی بابا Qwen3

برخی از نسخه‌های Qwen3 از معماری Mixture of Experts (MoE) استفاده می‌کنند. این معماری وظایف را بین مدل‌های کوچکتر و تخصصی تقسیم کرده و از نظر محاسباتی بهینه‌تر است. چنین طراحی‌ای به مدل‌های Qwen3 کمک می‌کند تا در پاسخگویی سریع و دقیق به پرسش‌ها رقابتی عمل کنند.

طبق گفته‌ی تیم Qwen، مدل‌های Qwen3 از ۱۱۹ زبان پشتیبانی کرده و بر اساس مجموعه داده‌هایی شامل ۳۶ تریلیون توکن آموزش دیده‌اند. این مجموعه داده شامل منابع مختلفی مانند کتاب‌های درسی، کدهای برنامه‌نویسی، داده‌های هوش مصنوعی و جفت‌های پرسش و پاسخ است. این گستردگی باعث بهبود چشمگیر مدل نسبت به نسخه‌ی قبلی یعنی Qwen2 شده است.

بزرگ‌ترین مدل Qwen3 یعنی Qwen-3-235B-A22B توانسته در آزمون‌هایی مانند Codeforces، AIME و BFCL از مدل‌های o3-mini و Gemini 2.5 Pro پیشی بگیرد. اگرچه این مدل هنوز به‌صورت عمومی منتشر نشده است، نسخه‌ی Qwen3-32B که در دسترس عموم قرار دارد، عملکردی مشابه یا حتی بهتر از مدل‌های پیشرفته چینی و مدل OpenAI o1 نشان داده است.

از دیگر ویژگی‌های برجسته‌ی Qwen3 می‌توان به قابلیت فراخوانی ابزارها، پیروی دقیق از دستورالعمل‌ها و انطباق با قالب داده‌ها اشاره کرد. این مدل‌ها علاوه‌بر امکان دانلود، از طریق ارائه‌دهندگان ابری مانند Fireworks AI نیز قابل استفاده هستند. کارشناسان بر این باورند که پیشرفت‌های اخیر نشان‌دهنده‌ی قدرت گرفتن مدل‌های متن‌باز در رقابت با غول‌های فناوری غربی است.

نوشته های مشابه

دکمه بازگشت به بالا