بله | کانال عصر گویش

۳ تیر

۵۱۹

۶:۵۷

VibeThinker-3B: اندازه مهم نیست، کارایی مهم است!
شرکت سینا ویبو از مدل جدید خود با نام VibeThinker-3B رونمایی کرده است. این مدل با تنها ۳ میلیارد پارامتر، در برخی از سخت‌ترین آزمون‌های منطقی به پای مدل‌های غول‌پیکری مثل Gemini 3 Pro و DeepSeek V3.2 رسیده است.

عملکرد خیره‌کننده در اعداد:
-

ریاضیات: امتیاز ۹۴.۳ در آزمون AIME26 (که با فناوری CLR به ۹۷.۱ می‌رسد). این یعنی این مدل کوچک در ریاضیات در سطح بهترین مدل‌های دنیا قرار دارد.
-

برنامه‌نویسی: موفقیت ۸۰.۲٪ در بنچمارک LiveCodeBench و ۹۶.۱٪ قبولی در مسائل جدید LeetCode. این یعنی مدل حتی در مواجهه با مسائل ناآشنا و جدید، عملکرد فوق‌العاده‌ای دارد.
-

دقت در پیروی از دستورات: امتیاز ۹۳.۴ در آزمون IFEval نشان می‌دهد که توانایی بالای استدلال این مدل، به قیمت از دست دادن توانایی پیروی از دستورات دقیق کاربر تمام نشده است.

راز موفقیت چیست؟
تیم سازنده از رویکرد جدیدی به نام «از طیف تا سیگنال» و یک روش آموزش چندمرحله‌ای مبتنی بر یادگیری تقویتی استفاده کرده است. فرضیه آن‌ها این است که هسته‌ی منطقی مدل را می‌توان به شدت فشرده کرد، در حالی که پارامترهای حجیم بیشتر برای ذخیره‌سازی اطلاعات عمومی و دانش دایرةالمعارفی مورد نیاز هستند.

نتیجه‌گیری:
VibeThinker-3B نشان می‌دهد که برای رسیدن به هوش مصنوعی قدرتمند، همیشه نیازی به مدل‌های با میلیاردها پارامتر نیست. با روش‌های آموزشی هوشمندانه، می‌توان مدل‌های کوچک و کارآمدی ساخت که در حوزه‌های خاص (مانند ریاضیات و برنامه‌نویسی) با غول‌های صنعت رقابت کنند. این یعنی هوش مصنوعی قدرتمند، قابل‌دسترس‌تر از چیزی است که فکر می‌کنیم.

منبع: مقاله روی arXiv
#AI #VibeThinker #هوش_مصنوعی