استارتاپ بنگلورویی Sarvam AI میگوید در حوزه OCR و گفتار چندزبانه، از رقبایی مانند ChatGPT و Gemini جلو زده است؛ آن هم در زبانهای پیچیده و متنوع هند که معمولاً پاشنه آشیل مدلهای جهانی هستند.
مدل "Sarvam Vision" در خواندن جداول، نمودارها و متون تصویری عملکرد پیشرفتهای دارد و "Bulbul V3" با پشتیبانی از ۲۲ زبان رسمی هند و ۳۵ صدای مختلف، تجربهای طبیعیتر برای کاربران چندزبانه فراهم میکند. سروم AI این رویکرد را «هوش مصنوعی حاکمیتی» مینامد؛ یعنی ساخت مدلی متناسب با فرهنگ و دادههای بومی.
اگر این ادعاها در عمل هم ثابت شود، رقابت در بازار جهانی AI وارد مرحله تازهای میشود؛ مرحلهای که در آن توجه به زبان و فرهنگ، به اندازه مقیاس و قدرت پردازش اهمیت دارد. مطالعه متن خبر
#هوش_مصنوعی#مرکز_نوآوری_و_توسعه_هوش_مصنوعی#پژوهشگاه_ارتباطات_و_فناوری_اطلاعات#جمنای#چت_جی_پی_تی#هند
۸:۲۶