Google از نسخه جدید مدل پرچمدار خود یعنی Gemini 3.1 Pro رونمایی کرد؛ مدلی که طبق اعلام این شرکت، در برخی بنچمارکهای کلیدی حتی از GPT-5.2 هم جلو زده است.
جمینای ۳.۱ پرو در آزمون Humanity’s Last Exam امتیاز ۴۴.۴٪ را ثبت کرده و در تست ARC-AGI-2 عملکردش از ۳۱٪ به ۷۷٪ رسیده؛ رشدی که نشان میدهد گوگل تمرکز ویژهای روی «استدلال پیشرفته» گذاشته است.
این مدل حالا میتواند بلوکهای بزرگتری از کد را پردازش کند، خطاها را دقیقتر رفع کند و اسناد بسیار طولانی (تا یک میلیون توکن ورودی) را بدون نیاز به تقسیمبندی تحلیل کند.در بنچمارک APEX-Agents هم عملکردش تقریباً دو برابر شده؛ نشانهای از حرکت جدی گوگل به سمت کاربردهای واقعی و چندمرحلهای در کسبوکارها.
با وجود این پیشرفتها، در برخی رتبهبندیهای کاربرمحور مانند Arena، مدل Claude Opus 4.6 همچنان در بعضی وظایف متنی و کدنویسی بالاتر قرار دارد.
قیمت API بدون تغییر باقی مانده؛ موضوعی که میتواند برای استارتاپها و تیمهای سازمانی خبر خوبی باشد.
رقابت مدلهای هوش مصنوعی حالا فقط بر سر «هوشمندتر بودن» نیست؛ بلکه بر سر «کاربردیتر بودن» است.آیا جمینای ۳.۱ پرو میتواند معادلات بازار سازمانی را تغییر دهد؟
#هوش_مصنوعی#مرکز_نوآوری_و_توسعه_هوش_مصنوعی#پژوهشگاه_ارتباطات_و_فناوری_اطلاعات#جمنای_پرو#استدلال
۶:۲۲