رونمایی از هوش مصنوعی جدید شرکت علی بابا به نام Qwen3

مدلهای هوش مصنوعی Qwen3 از شرکت علیبابا با استفاده از ۶۰۰ میلیون تا ۲۳۵ میلیارد پارامتر، عملکرد چشمگیری نسبت به رقبا از خود نشان میدهند.
شرکت چینی علیبابا از سری جدید مدلهای هوش مصنوعی خود با نام Qwen3 رونمایی کرده است. به گفتهی این غول فناوری، مدلهای جدید در برخی از آزمایشها توانستهاند عملکردی مشابه یا حتی بهتر از مدلهای پیشرفتهی گوگل و OpenAI داشته باشند. این مدلها از ۶۰۰ میلیون تا ۲۳۵ میلیارد پارامتر بهره میبرند و بسیاری از آنها بهصورت متنباز در پلتفرمهایی همچون گیتهاب و Hugging Face در دسترس قرار گرفتهاند یا بهزودی در دسترس خواهند بود.
مدلهای Qwen3 بهصورت “ترکیبی” طراحی شدهاند، بدین معنا که میتوانند بسته به نوع وظیفه، با صرف زمان بیشتر مسائل پیچیده را حل کنند یا بهسرعت به درخواستهای ساده پاسخ دهند. این رویکرد مشابه تواناییهای مدلهای OpenAI همچون o3 است و امکان تنظیم بهینهی بودجهی پردازشی برای هر وظیفه را فراهم میکند.
برخی از نسخههای Qwen3 از معماری Mixture of Experts (MoE) استفاده میکنند. این معماری وظایف را بین مدلهای کوچکتر و تخصصی تقسیم کرده و از نظر محاسباتی بهینهتر است. چنین طراحیای به مدلهای Qwen3 کمک میکند تا در پاسخگویی سریع و دقیق به پرسشها رقابتی عمل کنند.
طبق گفتهی تیم Qwen، مدلهای Qwen3 از ۱۱۹ زبان پشتیبانی کرده و بر اساس مجموعه دادههایی شامل ۳۶ تریلیون توکن آموزش دیدهاند. این مجموعه داده شامل منابع مختلفی مانند کتابهای درسی، کدهای برنامهنویسی، دادههای هوش مصنوعی و جفتهای پرسش و پاسخ است. این گستردگی باعث بهبود چشمگیر مدل نسبت به نسخهی قبلی یعنی Qwen2 شده است.
بزرگترین مدل Qwen3 یعنی Qwen-3-235B-A22B توانسته در آزمونهایی مانند Codeforces، AIME و BFCL از مدلهای o3-mini و Gemini 2.5 Pro پیشی بگیرد. اگرچه این مدل هنوز بهصورت عمومی منتشر نشده است، نسخهی Qwen3-32B که در دسترس عموم قرار دارد، عملکردی مشابه یا حتی بهتر از مدلهای پیشرفته چینی و مدل OpenAI o1 نشان داده است.
از دیگر ویژگیهای برجستهی Qwen3 میتوان به قابلیت فراخوانی ابزارها، پیروی دقیق از دستورالعملها و انطباق با قالب دادهها اشاره کرد. این مدلها علاوهبر امکان دانلود، از طریق ارائهدهندگان ابری مانند Fireworks AI نیز قابل استفاده هستند. کارشناسان بر این باورند که پیشرفتهای اخیر نشاندهندهی قدرت گرفتن مدلهای متنباز در رقابت با غولهای فناوری غربی است.