۱۷:۳۳
۱۷:۳۳
🧬 کاتالوگ اپلیکیشنها به ChatGPT اضافه شدقبلاً اتصال سرویسهایی مثل Google Drive و Photoshop داخل بخش تنظیمات و قسمت «Connectors» مخفی بود، اما حالا همه آنها به یک بخش جدا منتقل شدهاند: https://chatgpt.com/appsدر این بخش میتوانید اپلیکیشنها را وصل کنید و مستقیماً داخل چت با دستور @ اجراشان کنید.توسعهدهندهها هم میتوانند برای اضافهکردن اپهای خود درخواست بدهند. SDK در دسترس است و امکان کسب درآمد (Monetization) هم فراهم شده است.
۱۷:۳۳
یعنی لازم نیست هر بار بری از سایتهای مختلف لوگو پیدا کنی یا کیفیتشون رو درست کنی. همه آیکونها با فرمتهای سبک مثل SVG و PNG آمادهان و بدون دردسر میتونی توی سایت یا اپ ازشون استفاده کنی.
خوبیش اینه که وقتی ازش داخل پروژههای React استفاده میکنی، فقط همون آیکونهایی که واقعاً لازم داری وارد باندل میشن و پروژه سنگین نمیشه. اگه هم نخوای پکیج نصب کنی، میتونی خیلی راحت تو سه تا فرمت مختلف دانلود کنی.
این مجموعه برای کسایی که دارن یه محصول یا ابزار مرتبط با هوشمصنوعی میسازن خیلی بهدردبخوره، چون برندها و مدلهای مختلف رو پوشش میده. مثلاً لوگوی OpenAI، Midjourney، جمینای و بقیه سرویسها رو تمیز و با کیفیت ثابت کنار هم داری. این باعث میشه ظاهر پروژهت مرتب و حرفهای بشه و وقتت هم صرف پیدا کردن لوگوی درست یا تبدیل فرمتها نشه.
۱۷:۳۴
۱۷:۳۴
کمپانی DeepSeek امروز از دو مدل تازه خودش با نامهای DeepSeek-V3.2 و DeepSeek-V3.2-Speciale رونمایی کرد. این دو مدل روی ایده «اولویت دادن به استدلال» ساخته شدن و هدفشون اینه که عملکرد سیستمهای عاملمحور و ابزارمحور رو یک پله بالاتر ببرن.
مدل V3.2 که جانشین نسخه V3.2-Exp حساب میشه. الان روی اپ، وب و API در دسترسه. DeepSeek میگه این مدل توی کارهای روزمره سطح عملکردی نزدیک GPT-5 ارائه میده و بین سرعت استنتاج و طول خروجی هم توازن خوبی داره.
نسخه V3.2-Speciale فعلاً فقط روی API قابل استفادهست. این مدل روی نهایت توان استدلالی تنظیم شده. شرکت ادعا میکنه این نسخه توی کارهای پیچیده حتی با جمینای ۳ پرو رقابت میکنه.
طبق نتائج منتشرشده. هر دو مدل توی مسابقات جهانی مثل IMO. CMO. ICPC World Finals و IOI 2025 عملکرد خیلی بالایی داشتن.
کمپانی DeepSeek توضیح داده که Speciale برای پژوهش و ارزیابی جامعه منتشر شده. ولی مصرف توکن بیشتری داره. ضمن اینکه این نسخه ابزار داخلی نداره و مستقیماً روی استدلال خالص کار میکنه.
یکی از بخشهای مهم این بهروزرسانی هم آموزش گسترده روی دادههای مرتبط با ابزارهاست. شرکت میگه برای ساخت این مدلها بیش از ۱۸۰۰ محیط مختلف و حدود ۸۵ هزار دستور پیچیده رو استفاده کرده. مدل V3.2 هم حالا میتونه همزمان با فکرکردن. از ابزارها به شکل هوشمندتر استفاده کنه و بین حالت «با فکر» و «بیفکر» جابهجا بشه.
هر دو مدل بهصورت متنباز منتشر شدن و نسخههای مختلفشون از طریق Hugging Face در دسترسه. DeepSeek میگه V3.2 استفاده از ابزارها رو پختهتر کرده. و V3.2-Speciale یک معیار تازه برای مدلهای استدلالمحور ایجاد میکنه.
مدل V3.2 که جانشین نسخه V3.2-Exp حساب میشه. الان روی اپ، وب و API در دسترسه. DeepSeek میگه این مدل توی کارهای روزمره سطح عملکردی نزدیک GPT-5 ارائه میده و بین سرعت استنتاج و طول خروجی هم توازن خوبی داره.
نسخه V3.2-Speciale فعلاً فقط روی API قابل استفادهست. این مدل روی نهایت توان استدلالی تنظیم شده. شرکت ادعا میکنه این نسخه توی کارهای پیچیده حتی با جمینای ۳ پرو رقابت میکنه.
طبق نتائج منتشرشده. هر دو مدل توی مسابقات جهانی مثل IMO. CMO. ICPC World Finals و IOI 2025 عملکرد خیلی بالایی داشتن.
کمپانی DeepSeek توضیح داده که Speciale برای پژوهش و ارزیابی جامعه منتشر شده. ولی مصرف توکن بیشتری داره. ضمن اینکه این نسخه ابزار داخلی نداره و مستقیماً روی استدلال خالص کار میکنه.
یکی از بخشهای مهم این بهروزرسانی هم آموزش گسترده روی دادههای مرتبط با ابزارهاست. شرکت میگه برای ساخت این مدلها بیش از ۱۸۰۰ محیط مختلف و حدود ۸۵ هزار دستور پیچیده رو استفاده کرده. مدل V3.2 هم حالا میتونه همزمان با فکرکردن. از ابزارها به شکل هوشمندتر استفاده کنه و بین حالت «با فکر» و «بیفکر» جابهجا بشه.
هر دو مدل بهصورت متنباز منتشر شدن و نسخههای مختلفشون از طریق Hugging Face در دسترسه. DeepSeek میگه V3.2 استفاده از ابزارها رو پختهتر کرده. و V3.2-Speciale یک معیار تازه برای مدلهای استدلالمحور ایجاد میکنه.
۱۷:۳۴
بر اساس دادههای تازهای که Similarweb منتشر کرده، ابزار هوش مصنوعی Grok که توسط xAI توسعه داده شده، برای دومین ماه پیاپی در صدر جدول «میانگین مدت زمان بازدید کاربران» بین پلتفرمهای هوش مصنوعی مولد قرار گرفته. این آمار مربوط به بازه زمانی دی ۱۴۰۳ تا آبان ۱۴۰۴ه و رفتار کاربران جهانی رو بررسی میکنه.
طبق نمودار تحلیلی Similarweb که میانگین زمان صرفشده کاربران در وبسایتهای ChatGPT ، Gemini و Grok رو نشون میده، تا مرداد ۱۴۰۴ همچنان ChatGPT پیشتاز بوده. اما از شهریور ۱۴۰۴، Gemini با افزایش قابل توجه زمان استفاده، برای اولین بار از ChatGPT جلو زده. این روند زیاد دوام نداشته. چون در مهر ۱۴۰۴، Grok با یک جهش جدی از Gemini عبور کرده و در آبان ۱۴۰۴ هم جایگاهش رو حفظ کرده. میانگین زمان حضور کاربران در Grok حدود ۷ دقیقه ثبت شده که بالاترین عدد بین رقباست.
این دادهها نشون میده تمرکز کاربران داره از «تعداد بازدید» به «عمق تعامل» تغییر میکنه. یعنی کاربرها بیشتر دنبال ابزارین که بشه باهاشون مکالمه طولانیتر داشت و مسئلههای پیچیدهتری رو جلو برد. Grok با رویکرد پاسخدهی کمفیلتر، دسترسی به اطلاعات لحظهای و ادغام مستقیم با پلتفرم X تونسته توجه بخش قابل توجهی از کاربران رو جلب کنه.
وبسایت Similarweb که یکی از معتبرترین مراجع تحلیل ترافیک دیجیتاله، این آمار رو بر اساس دادههای واقعی بازدید از وبسایتهای رسمی این ابزارها استخراج کرده. این روند میتونه نشونه تشدید رقابت در بازار هوش مصنوعی مولد باشه. در حالی که ChatGPT هنوز از نظر تعداد کل بازدید جلوتره، افزایش مدت زمان تعامل با Grok نشون میده خیلی از کاربرها این ابزار رو برای گفتوگوهای عمیقتر و استفادههای طولانیمدت مناسبتر میدونن.
طبق نمودار تحلیلی Similarweb که میانگین زمان صرفشده کاربران در وبسایتهای ChatGPT ، Gemini و Grok رو نشون میده، تا مرداد ۱۴۰۴ همچنان ChatGPT پیشتاز بوده. اما از شهریور ۱۴۰۴، Gemini با افزایش قابل توجه زمان استفاده، برای اولین بار از ChatGPT جلو زده. این روند زیاد دوام نداشته. چون در مهر ۱۴۰۴، Grok با یک جهش جدی از Gemini عبور کرده و در آبان ۱۴۰۴ هم جایگاهش رو حفظ کرده. میانگین زمان حضور کاربران در Grok حدود ۷ دقیقه ثبت شده که بالاترین عدد بین رقباست.
این دادهها نشون میده تمرکز کاربران داره از «تعداد بازدید» به «عمق تعامل» تغییر میکنه. یعنی کاربرها بیشتر دنبال ابزارین که بشه باهاشون مکالمه طولانیتر داشت و مسئلههای پیچیدهتری رو جلو برد. Grok با رویکرد پاسخدهی کمفیلتر، دسترسی به اطلاعات لحظهای و ادغام مستقیم با پلتفرم X تونسته توجه بخش قابل توجهی از کاربران رو جلب کنه.
وبسایت Similarweb که یکی از معتبرترین مراجع تحلیل ترافیک دیجیتاله، این آمار رو بر اساس دادههای واقعی بازدید از وبسایتهای رسمی این ابزارها استخراج کرده. این روند میتونه نشونه تشدید رقابت در بازار هوش مصنوعی مولد باشه. در حالی که ChatGPT هنوز از نظر تعداد کل بازدید جلوتره، افزایش مدت زمان تعامل با Grok نشون میده خیلی از کاربرها این ابزار رو برای گفتوگوهای عمیقتر و استفادههای طولانیمدت مناسبتر میدونن.
۱۸:۳۱
��s_Handbook,_Second_Edition_Build,_integrate,.pdf
۶.۵۶ مگابایت
این کتاب برای کسایی نوشته شده که میخوان وارد دنیای AI Product Management بشن، کسبوکار خودشون رو راه بندازن یا فقط کنجکاون بدونن ساختن یه محصول AI چه ملاحظاتی داره.
اگر الان تو حوزهی Product Management فعالیت میکنین و دوست دارین بفهمین چطور میشه محصولهای AI ساخت، این کتاب میتونه خیلی بهتون کمک کنه. همینطور اگر در AI Development کار میکنین و قصد دارین این مفاهیم رو وارد فضای Product Management کنین و نقش بیزینسیتری بگیرین، باز هم مخاطب همین کتاب هستین. هرچند بعضی فصلها رنگوبوی فنیتر دارن، اما تمام محتوای تکنیکی در حد مبتدی و قابل فهم برای همه نوشته شده تا بدون پیشزمینهی خاص هم بتونین ازش استفاده کنین. از دستش ندید!
اگر الان تو حوزهی Product Management فعالیت میکنین و دوست دارین بفهمین چطور میشه محصولهای AI ساخت، این کتاب میتونه خیلی بهتون کمک کنه. همینطور اگر در AI Development کار میکنین و قصد دارین این مفاهیم رو وارد فضای Product Management کنین و نقش بیزینسیتری بگیرین، باز هم مخاطب همین کتاب هستین. هرچند بعضی فصلها رنگوبوی فنیتر دارن، اما تمام محتوای تکنیکی در حد مبتدی و قابل فهم برای همه نوشته شده تا بدون پیشزمینهی خاص هم بتونین ازش استفاده کنین. از دستش ندید!
۱۸:۳۳
کارپاتی (Andrej Karpathy)، یکی از متخصصان برجسته هوش مصنوعی (از OpenAI و تسلا)، در این پست اعتراف میکنه که برای اولین بار در زندگی حرفهایش احساس میکنه به شدت از برنامهنویسی عقب افتاده.
دلیلش اینه که ابزارهای هوش مصنوعی دارن سبک جدیدی از کد زدن رو معرفی میکنن: کدهای پراکنده و با اهرم بالا (sparse, high-leverage) در میان اکوسیستمهای متراکم از ایجنتهای هوش مصنوعی.
اون میگه حالا یک لایه انتزاع جدید به وجود اومده — شامل پرامپتها، حافظه، ابزارها و جریانهای کاری — برای ادغام هوش مصنوعی که گاهی خطا میکنه و رفتارش تصادفی (stochastic) هست. این لایه مثل یک «ابزار بیگانه» بدون دفترچه راهنماست که باید خیلی سریع یاد بگیری چطور ازش استفاده کنی.
این پست نشوندهنده یک تحول بزرگ در صنعت در سال ۲۰۲۵ هست؛ جایی که طبق نظرسنجیهای مثل Stack Overflow Developer Survey ۲۰۲۴، حدود ۷۰٪ برنامهنویسان از دستیارهای هوش مصنوعی استفاده میکنن. این ابزارها بهرهوری رو خیلی بالا میبرن، اما همزمان شکاف مهارتی جدیدی در مهندسی ترکیبی انسان-هوش مصنوعی ایجاد کردن.
دلیلش اینه که ابزارهای هوش مصنوعی دارن سبک جدیدی از کد زدن رو معرفی میکنن: کدهای پراکنده و با اهرم بالا (sparse, high-leverage) در میان اکوسیستمهای متراکم از ایجنتهای هوش مصنوعی.
اون میگه حالا یک لایه انتزاع جدید به وجود اومده — شامل پرامپتها، حافظه، ابزارها و جریانهای کاری — برای ادغام هوش مصنوعی که گاهی خطا میکنه و رفتارش تصادفی (stochastic) هست. این لایه مثل یک «ابزار بیگانه» بدون دفترچه راهنماست که باید خیلی سریع یاد بگیری چطور ازش استفاده کنی.
این پست نشوندهنده یک تحول بزرگ در صنعت در سال ۲۰۲۵ هست؛ جایی که طبق نظرسنجیهای مثل Stack Overflow Developer Survey ۲۰۲۴، حدود ۷۰٪ برنامهنویسان از دستیارهای هوش مصنوعی استفاده میکنن. این ابزارها بهرهوری رو خیلی بالا میبرن، اما همزمان شکاف مهارتی جدیدی در مهندسی ترکیبی انسان-هوش مصنوعی ایجاد کردن.
۱۸:۳۳
طبق آمار تازهای که Similarweb منتشر کرده، میزان بازدید ماهانه از ابزارهای هوش مصنوعی تو دنیا هنوز با سرعت بالایی داره رشد میکنه. مجموع بازدیدهای این ابزارها نسبت به پارسال حدود ۷۶ درصد بیشتر شده و الان به بالای ۷ میلیارد بازدید در ماه رسیده.
مدل ChatGPT هنوز با اختلاف اوله، ولی سهمش یه مقدار کمتر شده.آبان ۱۴۰۴. ۷۴٫۲۵ درصددی ۱۴۰۳. ۷۸٫۵۹ درصدیعنی همچنان بیشترین ترافیک رو میگیره، اما سهمش دیگه مثل قبل باثبات نیست.
مدل Gemini رشد خیلی سریعی داشته و سهمش تقریباً سه برابر شده.آبان ۱۴۰۴. ۱۴٫۹۵ درصددی ۱۴۰۳. ۵٫۶۴ درصدبخش زیادی از این رشد به این برمیگرده که Gemini مستقیماً تو سرویسهای گوگل دیده میشه و کاربرها بدون تصمیم آگاهانه، بهش هدایت میشن.
مدل DeepSeek افت محسوسی داشته و سهمش تقریباً نصف شده.آبان ۱۴۰۴. ۵٫۳۵ درصددی ۱۴۰۳. ۱۲٫۷۹ درصد
مدل Grok که محصول xAI هست، بیشترین جهش رو ثبت کرده. از تقریباً صفر رسیده به عدد قابل توجه.آبان ۱۴۰۴. ۲٫۵۳ درصددی ۱۴۰۳. ۰٫۰۲ درصد
مدل Perplexity هم تقریباً ثابت مونده و تغییر خاصی نداشته.آبان ۱۴۰۴. ۲٫۹۱ درصددی ۱۴۰۳. ۲٫۹۶ درصد
جمعبندی اینه که توزیع بازدیدها داره متنوعتر میشه. ChatGPT هنوز جلوتر از بقیهست، ولی روندها نشون میده ابزارهایی مثل Gemini و Grok دارن سریعتر از قبل سهم میگیرن. اگه این مسیر ادامه پیدا کنه، سال آینده احتمالاً با رقابت جدیتری سر ترافیک روبهرو میشیم.
مدل ChatGPT هنوز با اختلاف اوله، ولی سهمش یه مقدار کمتر شده.آبان ۱۴۰۴. ۷۴٫۲۵ درصددی ۱۴۰۳. ۷۸٫۵۹ درصدیعنی همچنان بیشترین ترافیک رو میگیره، اما سهمش دیگه مثل قبل باثبات نیست.
مدل Gemini رشد خیلی سریعی داشته و سهمش تقریباً سه برابر شده.آبان ۱۴۰۴. ۱۴٫۹۵ درصددی ۱۴۰۳. ۵٫۶۴ درصدبخش زیادی از این رشد به این برمیگرده که Gemini مستقیماً تو سرویسهای گوگل دیده میشه و کاربرها بدون تصمیم آگاهانه، بهش هدایت میشن.
مدل DeepSeek افت محسوسی داشته و سهمش تقریباً نصف شده.آبان ۱۴۰۴. ۵٫۳۵ درصددی ۱۴۰۳. ۱۲٫۷۹ درصد
مدل Grok که محصول xAI هست، بیشترین جهش رو ثبت کرده. از تقریباً صفر رسیده به عدد قابل توجه.آبان ۱۴۰۴. ۲٫۵۳ درصددی ۱۴۰۳. ۰٫۰۲ درصد
مدل Perplexity هم تقریباً ثابت مونده و تغییر خاصی نداشته.آبان ۱۴۰۴. ۲٫۹۱ درصددی ۱۴۰۳. ۲٫۹۶ درصد
جمعبندی اینه که توزیع بازدیدها داره متنوعتر میشه. ChatGPT هنوز جلوتر از بقیهست، ولی روندها نشون میده ابزارهایی مثل Gemini و Grok دارن سریعتر از قبل سهم میگیرن. اگه این مسیر ادامه پیدا کنه، سال آینده احتمالاً با رقابت جدیتری سر ترافیک روبهرو میشیم.
۱۸:۳۳
For anyone not deep in AI lore, the singularity means a point where AI improves itself faster than humans can understand or control.
Systems start designing better versions of themselves.
That’s when progress stops checking who’s in the room.
Systems start designing better versions of themselves.
That’s when progress stops checking who’s in the room.
۱۹:۳۰
"Both companies are reportedly planning to continue raising GPU prices every month going forward. It's highly likely that the price increases will extend across their entire product lineup, encompassing not only consumer GPUs but also GPUs for AI data centers and servers."
The downside of the AI revolution: prices in the consumer market are exploding.
۱۹:۳۵
۱۹:۳۵
لنوو هم دستیار هوش مصنوعی میسازد
لنوو دستیار هوش مصنوعی اختصاصیاش را رونمایی کرد؛ نه یک چتبات ساده، بلکه یک همراه همیشگی در اکوسیستم لنوو.
لنوو دستیار هوش مصنوعی اختصاصیاش را رونمایی کرد؛ نه یک چتبات ساده، بلکه یک همراه همیشگی در اکوسیستم لنوو.
۸:۲۲
۱۰:۳۶
معرفی سری Qwen 3.5 Medium
اگه دنبال اجرای مدلهای سطح بالا روی سیستم خودتون هستید و از حجمهای عجیبوغریب خسته شدید، تیم Qwen دیروز سری جدید Medium رو ریلیز کرد که بازی رو عوض کرده. شعار این سری "هوش بیشتر، محاسبات کمتر" هست و تمرکز کاملاً رفته روی معماری بهینه، کیفیت دیتا و RL سنگین برای ایجنتها.
نکته جذاب ماجرا اینه که این مدلها صرفاً متنی نیستن؛ به صورت Native قابلیتهای Multimodal (تصویر و ویدیو) دارن و قابلیت Thinking Modeداخلشون تعبیه شده که میتونید روشن یا خاموشش کنید.
مدلهای اصلی این خانواده:
مدل Qwen3.5-35B-A3B (MoE):ستارهی این ریلیز. کلاً ۳۵ میلیارد پارامتر داره اما برای هر توکن فقط ۳ میلیاردش فعال میشه.به نظر من این مدل "Value King" جدید دنیای اپنسورسه. روی یه سیستم با ۲۴ گیگ رم (یا مکبوک) به راحتی اجرا میشه و طبق بنچمارکها، مدل قبلی و غولپیکر Qwen3-235B رو شکست میده. خوراکِ کارهای لوکال و سیستمهای با منابع محدوده.
مدل Qwen3.5-122B-A10B (MoE):پل ارتباطی به مدلهای Frontier. با ۱۲۲ میلیارد پارامتر (۱۰ میلیارد فعال)، فاصلهی کمی با مدلهای بسته مثل GPT-5-mini داره، مخصوصاً توی سناریوهای پیچیده Agentic و Reasoning. اگر ستاپ Multi-GPU دارید، این گزینه برای پروداکشن عالیه.
مدل Qwen3.5-27B (Dense):یه مدل کلاسیک و متراکم (Non-MoE). توی کارهای کدنویسی و Long-Context عملکرد عجیب و غریبی داره و گاهی حتی برادران MoE خودش رو هم میزنه. چون Dense هست، پایداری بیشتری توی Instruction Following داره.
چرا این ریلیز مهمه؟همه مدلها لایسنس Apache 2.0 دارن، تا ۱ میلیون توکن Context رو ساپورت میکنن و توی بنچمارکهای Coding و Agentic، مدلهای Closed-source مثل GPT-5-mini و Claude-Sonnet-4.5 رو به چالش کشیدن (و جاهایی شکست دادن). جامعه کاربری خیلی سریع براشون GGUF ساخته و روی ابزارهایی مثل vLLM و Llama.cpp بالا میان.
اگر توسعهدهنده هستید، الان وقتشه که کلاسترها رو بیخیال بشید و روی Edge Deviceها هوش واقعی رو تست کنید.
لینک مدلها در هاگینگفیس:https://huggingface.co/collections/Qwen/qwen35
اگه دنبال اجرای مدلهای سطح بالا روی سیستم خودتون هستید و از حجمهای عجیبوغریب خسته شدید، تیم Qwen دیروز سری جدید Medium رو ریلیز کرد که بازی رو عوض کرده. شعار این سری "هوش بیشتر، محاسبات کمتر" هست و تمرکز کاملاً رفته روی معماری بهینه، کیفیت دیتا و RL سنگین برای ایجنتها.
نکته جذاب ماجرا اینه که این مدلها صرفاً متنی نیستن؛ به صورت Native قابلیتهای Multimodal (تصویر و ویدیو) دارن و قابلیت Thinking Modeداخلشون تعبیه شده که میتونید روشن یا خاموشش کنید.
مدلهای اصلی این خانواده:
مدل Qwen3.5-35B-A3B (MoE):ستارهی این ریلیز. کلاً ۳۵ میلیارد پارامتر داره اما برای هر توکن فقط ۳ میلیاردش فعال میشه.به نظر من این مدل "Value King" جدید دنیای اپنسورسه. روی یه سیستم با ۲۴ گیگ رم (یا مکبوک) به راحتی اجرا میشه و طبق بنچمارکها، مدل قبلی و غولپیکر Qwen3-235B رو شکست میده. خوراکِ کارهای لوکال و سیستمهای با منابع محدوده.
مدل Qwen3.5-122B-A10B (MoE):پل ارتباطی به مدلهای Frontier. با ۱۲۲ میلیارد پارامتر (۱۰ میلیارد فعال)، فاصلهی کمی با مدلهای بسته مثل GPT-5-mini داره، مخصوصاً توی سناریوهای پیچیده Agentic و Reasoning. اگر ستاپ Multi-GPU دارید، این گزینه برای پروداکشن عالیه.
مدل Qwen3.5-27B (Dense):یه مدل کلاسیک و متراکم (Non-MoE). توی کارهای کدنویسی و Long-Context عملکرد عجیب و غریبی داره و گاهی حتی برادران MoE خودش رو هم میزنه. چون Dense هست، پایداری بیشتری توی Instruction Following داره.
چرا این ریلیز مهمه؟همه مدلها لایسنس Apache 2.0 دارن، تا ۱ میلیون توکن Context رو ساپورت میکنن و توی بنچمارکهای Coding و Agentic، مدلهای Closed-source مثل GPT-5-mini و Claude-Sonnet-4.5 رو به چالش کشیدن (و جاهایی شکست دادن). جامعه کاربری خیلی سریع براشون GGUF ساخته و روی ابزارهایی مثل vLLM و Llama.cpp بالا میان.
اگر توسعهدهنده هستید، الان وقتشه که کلاسترها رو بیخیال بشید و روی Edge Deviceها هوش واقعی رو تست کنید.
۹:۲۰
۹:۲۰
به گفته Google DeepMind، این مدل بر پایه جدیدترین نسخه Gemini Flash ساخته شده و قراره سرعت بالا رو با کیفیت در سطح پرو ترکییب کنه. نانو بنانا ۲ از دادههای بهروز وب استفاده میکنه تا خروجی دقیقتری بده و میتونه داخل یک تصویر، ثبات تا ۵ کاراکتر و ۱۴ شیء رو حفظ کنه. در اجرای دستورهای پیچیده و چندمرحلهای هم عملکرد دقیقتری نسبت به نسخههای قبلی داره.
از نظر فنی، این مدل از رزولوشن ۵۱۲ پیکسل تا ۴K پشتیبانی میکنه و نسبتهای مختلف تصویر رو پوشش میده. رندر دقیق متن داخل تصویر و ترجمه اون برای تولید محتوای چندزبانه هم فراهم شده. امکان ویرایش معنایی تصویر با توضیح متنی و ترکیب چند تصویر مرجع هم در اختیار کاربرها قرار گرفته.
تصاویر تولیدشده با کمک ابزار SynthID دارای واترمارک نامرئی هستن و از استاندارد C2PA Content Credentials هم استفاده میکنن.
۹:۵۶
۹:۵۶
۹:۵۶