تجربه مکالمهای طبیعیتر: گوگل قابلیتهای جمینای در پردازش صدا را افزایش میدهد
شرکت گوگل بهتازگی از انتشار یک بهروزرسانی مهم برای مدل هوش مصنوعی خود، جمینای (Gemini)، خبر داده است. هدف اصلی این آپدیت، تقویت توانایی چتبات در مدیریت و پردازش گفتوگوهای طبیعی و روانتر شدن تعامل با دستیار مجازی است.
اگرچه هوش مصنوعی جمینای از زمان معرفی خود، مکالمه با دستیارهای مجازی را بسیار طبیعیتر از فرمانهای ساده به Google Assistant کرده است، اما گوگل همچنان در پی بهبود بیوقفه است. این بهروزرسانی برای Gemini 2.5 Flash Native Audio منتشر شده و بهطور ویژه بر روی ایِجنتهای صوتی زنده (Live Audio Agents) تمرکز دارد.
سه حوزه کلیدی برای بهبود کیفیت گفتوگو
گوگل اعلام کرده که در این آپدیت، روی سه بخش حیاتی برای ارتقای کیفیت تعاملات صوتی تمرکز کرده است:
- فراخوانی دقیقتر توابع (Function Calling): قابلیت اطمینان مدل در فعالسازی ابزارهای خارجی (مانند ابزارهای جستجوی لحظهای اطلاعات) بهطور قابل توجهی بهبود یافته است. اکنون جمینای میتواند با دقت بسیار بالاتری تشخیص دهد که چه زمانی در طول مکالمه باید اطلاعات بهروز جمعآوری کند و سپس این دادهها را بدون برهم زدن جریان گفتوگو، بهصورت یکپارچه در پاسخ صوتی خود بگنجاند.
- پیروی بهتر از دستورالعملها (Instruction Following): نرخ تعهد این مدل به دستورالعملهای ارائهشده توسط توسعهدهندگان به ۹۰ درصد رسیده که نسبت به رقم قبلی ۸۴ درصد، نشاندهنده یک پیشرفت مهم است. این یعنی جمینای میتواند دستورهای پیچیدهتر و چندمرحلهای را بهتر درک کرده و خروجیهای قابلاعتمادتری ارائه دهد.
- مکالمههای روانتر (Smoother Conversations): مدل Gemini 2.5 Flash Native Audio توانایی بالاتری در بازیابی زمینه و اطلاعات بخشهای قبلی مکالمه پیدا کرده است. نتیجه این بهبود، شکلگیری گفتوگوهایی منسجمتر، روانتر و با فهم بهتر از تاریخچه صحبتها است.
🔇 قابلیتهای جانبی: قطع نشدن و بیصدا کردن میکروفون
علاوه بر بهبودهای کلیدی بالا، هوش مصنوعی جمینای دو قابلیت جانبی هوشمند نیز دریافت کرده است که تجربه کاربر را بهبود میبخشد:
- تشخیص مکث کاربر: اگر هنگام صحبت با جمینای Live کمی مکث کنید (مثلاً برای فکر کردن یا نفس کشیدن)، چتبات صحبت شما را در میانه جمله قطع نخواهد کرد.
- امکان بیصدا کردن (Mute): کاربران میتوانند هنگام صحبت با این نسخه، میکروفون خود را بیصدا (Mute) کنند تا بهطور تصادفی یا ناخواسته، صحبت جمینای را قطع نکنند.
پوشش گسترده بهروزرسانی و تغییرات Google Translate
انتشار این بهروزرسانیها برای پلتفرمهای مختلف گوگل آغاز شده و شامل جمینای لایو (Gemini Live)، سرچ لایو (Search Live)، Google AI Studio و Vertex AI میشود.
گوگل همچنین از تغییرات جدیدی در اپلیکیشن Translate خبر داده است که شامل موارد زیر است:
- درک بهتر اصطلاحات: توانایی بالاتری در درک اصطلاحات، کنایهها و دیگر آرایههای زبانی پیچیده.
- گسترش Live Translate: افزایش پشتیبانی از زبانهای جدید برای قابلیت ترجمه زنده.
جمعبندی: آینده هوش مصنوعی محاورهای
این بهروزرسانیها نشان میدهند که گوگل عزم جدی برای تبدیل کردن هوش مصنوعی جمینای به یک دستیار صوتی بسیار طبیعی، قابل اعتماد و بدون وقفه دارد. تمرکز بر روان بودن مکالمه، کلید موفقیت در تعاملات آینده انسان و ماشین خواهد بود.







ارسال پاسخ