بلاگ
آشنایی کامل با مدل هوش مصنوعی Qwen3 علیبابا

شرکت فناوری علیبابا، غول اینترنتی چین، در فروردین ۱۴۰۴ (آوریل ۲۰۲۵) از نسل جدید مدلهای زبانی خود با نام Qwen3 رونمایی کرد؛ خانوادهای از مدلهای پیشرفته هوش مصنوعی که از نظر عملکرد با مدلهای برتر شرکتهایی همچون گوگل و OpenAI رقابت میکند. این مدلها با معماریهای متنوع، از جمله مدلهای متراکم (Dense) و مدلهای مبتنی بر Mixture of Experts (MoE)، در اندازههایی از ۶۰۰ میلیون تا ۲۳۵ میلیارد پارامتر توسعه یافتهاند.
بسیاری از مدلهای Qwen3 بهصورت متنباز در پلتفرمهای توسعهدهنده مانند Hugging Face و GitHub منتشر شدهاند یا بهزودی منتشر خواهند شد. این اقدام در ادامه روند جهانی توسعه مدلهای متنباز صورت گرفته که به شرکتهای کوچکتر و محققان امکان میدهد از توان مدلهای بزرگ بدون هزینه بالا بهره ببرند.
معماری هیبریدی و انعطافپذیری در پاسخگویی
مدلهای Qwen3 از معماری «هیبریدی» بهره میبرند. به این معنا که میتوانند بسته به نوع سؤال، بهصورت سریع یا با تفکر عمیق (reasoning) پاسخ بدهند. این ویژگی شبیهسازیشده از توانایی خودبازبینی (self-checking) است که در مدلهایی مانند OpenAI o3 نیز دیده میشود. کاربران همچنین میتوانند «بودجه تفکر» (thinking budget) را برای هر وظیفه بهصورت دلخواه تنظیم کنند؛ قابلیتی که انعطاف زیادی در تنظیم دقت و سرعت خروجی فراهم میکند.
مدلهای MoE نیز با تقسیم درخواست به زیروظایف تخصصی، بار پردازشی را میان ماژولهای تخصصی توزیع میکنند. این طراحی باعث میشود مدلها ضمن حفظ قدرت پاسخگویی، کارایی بهتری در مصرف منابع سختافزاری داشته باشند.
تواناییهای چندزبانه و دیتاست عظیم
به گفته علیبابا، مدلهای Qwen3 از ۱۱۹ زبان پشتیبانی میکنند و آموزش آنها با استفاده از دیتاستی شامل بیش از ۳۶ تریلیون توکن انجام شده است. این دادهها شامل متن کتابها، جفتهای سؤال و پاسخ، کدهای برنامهنویسی، اطلاعات تولیدشده توسط AI و دیگر منابع متنی متنوع بودهاند.
این وسعت داده آموزشی، باعث شده عملکرد Qwen3 در آزمونهای استاندارد در حوزههای کدنویسی، ریاضیات و استدلال منطقی بسیار چشمگیر باشد. برای مثال، مدل Qwen3-235B-A22B توانسته در برخی آزمونها مدل o3-mini از OpenAI و Gemini 2.5 Pro از گوگل را پشت سر بگذارد.
جایگاه Qwen3 در رقابت جهانی
اگرچه مدل اصلی Qwen3-235B فعلاً برای عموم منتشر نشده، اما نسخه عمومی Qwen3-32B توانسته در چندین معیار، از جمله LiveCodeBench، از مدلهای معروف متنباز و حتی برخی مدلهای انحصاری بهتر عمل کند. این موفقیتها نشاندهنده رقابتپذیری واقعی مدلهای علیبابا در برابر رقبای غربی است.
از دیگر قابلیتهای شاخص Qwen3 میتوان به توانایی بالا در فراخوانی ابزارها (Tool Calling)، تبعیت دقیق از دستورات پیچیده و تولید خروجی در قالب فرمتهای خاص اشاره کرد. این مدلها از طریق پلتفرمهای ابری مانند Fireworks AI و Hyperbolic نیز قابل دسترسی هستند.
Qwen3، نشاندهنده پیشرفت چین در حوزه هوش مصنوعی است؛ مدلی که علیبابا آن را نه تنها برای رقابت با غولهای آمریکایی، بلکه برای هدایت نسل جدیدی از ابزارهای کاربردی متنباز طراحی کرده است. در شرایطی که دسترسی شرکتهای چینی به چیپهای قدرتمند محدود شده، توسعه چنین مدلهایی نشان از بلوغ فنی چشمگیری در فضای AI آسیا دارد.