مرکز نوآوری و توسعه هوش مصنوعی پژوهشگاه ارتباطات و فناوری اطلاعات

http://ai-center.ir

مشاهده در اپلیکیشن بله مشاهده در وب بله

پیش‌نمایش کانال

جمینای ۳.۱ پرو معرفی شد؛ جهش بزرگ در استدلال و عملکرد عاملی
Google از نسخه جدید مدل پرچم‌دار خود یعنی Gemini 3.1 Pro رونمایی کرد؛ مدلی که طبق اعلام این شرکت، در برخی بنچمارک‌های کلیدی حتی از GPT-5.2 هم جلو زده است.

جهش دوبرابری در تست‌های استدلال
جمینای ۳.۱ پرو در آزمون Humanity’s Last Exam امتیاز ۴۴.۴٪ را ثبت کرده و در تست ARC-AGI-2 عملکردش از ۳۱٪ به ۷۷٪ رسیده؛ رشدی که نشان می‌دهد گوگل تمرکز ویژه‌ای روی «استدلال پیشرفته» گذاشته است.

تمرکز جدی روی کدنویسی و کار سازمانی
این مدل حالا می‌تواند بلوک‌های بزرگ‌تری از کد را پردازش کند، خطاها را دقیق‌تر رفع کند و اسناد بسیار طولانی (تا یک میلیون توکن ورودی) را بدون نیاز به تقسیم‌بندی تحلیل کند.در بنچمارک APEX-Agents هم عملکردش تقریباً دو برابر شده؛ نشانه‌ای از حرکت جدی گوگل به سمت کاربردهای واقعی و چندمرحله‌ای در کسب‌وکارها.
با وجود این پیشرفت‌ها، در برخی رتبه‌بندی‌های کاربرمحور مانند Arena، مدل Claude Opus 4.6 همچنان در بعضی وظایف متنی و کدنویسی بالاتر قرار دارد.
قیمت API بدون تغییر باقی مانده؛ موضوعی که می‌تواند برای استارتاپ‌ها و تیم‌های سازمانی خبر خوبی باشد.
رقابت مدل‌های هوش مصنوعی حالا فقط بر سر «هوشمندتر بودن» نیست؛ بلکه بر سر «کاربردی‌تر بودن» است.آیا جمینای ۳.۱ پرو می‌تواند معادلات بازار سازمانی را تغییر دهد؟

مطالعه متن خبر
#هوش_مصنوعی#مرکز_نوآوری_و_توسعه_هوش_مصنوعی#پژوهشگاه_ارتباطات_و_فناوری_اطلاعات#جمنای_پرو#استدلال

Aicenter

۶:۲۲