گوگل قابلیت‌های جمینای در پردازش گفت‌وگوی طبیعی را تقویت می‌کند

تجربه مکالمه‌ای طبیعی‌تر: گوگل قابلیت‌های جمینای در پردازش صدا را افزایش می‌دهد

شرکت گوگل به‌تازگی از انتشار یک به‌روزرسانی مهم برای مدل هوش مصنوعی خود، جمینای (Gemini)، خبر داده است. هدف اصلی این آپدیت، تقویت توانایی چت‌بات در مدیریت و پردازش گفت‌وگوهای طبیعی و روان‌تر شدن تعامل با دستیار مجازی است.

اگرچه هوش مصنوعی جمینای از زمان معرفی خود، مکالمه با دستیارهای مجازی را بسیار طبیعی‌تر از فرمان‌های ساده به Google Assistant کرده است، اما گوگل همچنان در پی بهبود بی‌وقفه است. این به‌روزرسانی برای Gemini 2.5 Flash Native Audio منتشر شده و به‌طور ویژه بر روی ایِجنت‌های صوتی زنده (Live Audio Agents) تمرکز دارد.

سه حوزه کلیدی برای بهبود کیفیت گفت‌وگو

گوگل اعلام کرده که در این آپدیت، روی سه بخش حیاتی برای ارتقای کیفیت تعاملات صوتی تمرکز کرده است:

  1. فراخوانی دقیق‌تر توابع (Function Calling): قابلیت اطمینان مدل در فعال‌سازی ابزارهای خارجی (مانند ابزارهای جستجوی لحظه‌ای اطلاعات) به‌طور قابل توجهی بهبود یافته است. اکنون جمینای می‌تواند با دقت بسیار بالاتری تشخیص دهد که چه زمانی در طول مکالمه باید اطلاعات به‌روز جمع‌آوری کند و سپس این داده‌ها را بدون برهم زدن جریان گفت‌وگو، به‌صورت یکپارچه در پاسخ صوتی خود بگنجاند.
  2. پیروی بهتر از دستورالعمل‌ها (Instruction Following): نرخ تعهد این مدل به دستورالعمل‌های ارائه‌شده توسط توسعه‌دهندگان به ۹۰ درصد رسیده که نسبت به رقم قبلی ۸۴ درصد، نشان‌دهنده یک پیشرفت مهم است. این یعنی جمینای می‌تواند دستورهای پیچیده‌تر و چندمرحله‌ای را بهتر درک کرده و خروجی‌های قابل‌اعتمادتری ارائه دهد.
  3. مکالمه‌های روان‌تر (Smoother Conversations): مدل Gemini 2.5 Flash Native Audio توانایی بالاتری در بازیابی زمینه و اطلاعات بخش‌های قبلی مکالمه پیدا کرده است. نتیجه این بهبود، شکل‌گیری گفت‌وگوهایی منسجم‌تر، روان‌تر و با فهم بهتر از تاریخچه صحبت‌ها است.

🔇 قابلیت‌های جانبی: قطع نشدن و بی‌صدا کردن میکروفون

علاوه بر بهبودهای کلیدی بالا، هوش مصنوعی جمینای دو قابلیت جانبی هوشمند نیز دریافت کرده است که تجربه کاربر را بهبود می‌بخشد:

  • تشخیص مکث کاربر: اگر هنگام صحبت با جمینای Live کمی مکث کنید (مثلاً برای فکر کردن یا نفس کشیدن)، چت‌بات صحبت شما را در میانه جمله قطع نخواهد کرد.
  • امکان بی‌صدا کردن (Mute): کاربران می‌توانند هنگام صحبت با این نسخه، میکروفون خود را بی‌صدا (Mute) کنند تا به‌طور تصادفی یا ناخواسته، صحبت جمینای را قطع نکنند.

پوشش گسترده به‌روزرسانی و تغییرات Google Translate

انتشار این به‌روزرسانی‌ها برای پلتفرم‌های مختلف گوگل آغاز شده و شامل جمینای لایو (Gemini Live)، سرچ لایو (Search Live)، Google AI Studio و Vertex AI می‌شود.

گوگل همچنین از تغییرات جدیدی در اپلیکیشن Translate خبر داده است که شامل موارد زیر است:

  • درک بهتر اصطلاحات: توانایی بالاتری در درک اصطلاحات، کنایه‌ها و دیگر آرایه‌های زبانی پیچیده.
  • گسترش Live Translate: افزایش پشتیبانی از زبان‌های جدید برای قابلیت ترجمه زنده.

جمع‌بندی: آینده هوش مصنوعی محاوره‌ای

این به‌روزرسانی‌ها نشان می‌دهند که گوگل عزم جدی برای تبدیل کردن هوش مصنوعی جمینای به یک دستیار صوتی بسیار طبیعی، قابل اعتماد و بدون وقفه دارد. تمرکز بر روان بودن مکالمه، کلید موفقیت در تعاملات آینده انسان و ماشین خواهد بود.

Telegram

عضو کانال تلگرام ما شوید!

به جدیدترین مقالات، اخبار تکنولوژی و تحلیل‌ها در تلگرام دسترسی داشته باشید.

ورود به کانال