גוגל משדרגת את ג'מיני 2.5: שמע מקורי מתקדם לשיחות טבעיות
מוצר חדש

גוגל משדרגת את ג'מיני 2.5: שמע מקורי מתקדם לשיחות טבעיות

עדכון חדש למודל Native Audio מאפשר סוכני קול חכמים יותר, תרגום בזמן אמת ותמיכה בשיחות מורכבות – זמין כעת ב-Vertex AI ובאפליקציית Translate

AI
אוטומציות AI
4 דקות קריאה

תקציר מנהלים

נקודות עיקריות

  • שדרוג ל-Gemini 2.5 Flash Native Audio משפר קריאת פונקציות, מעקב הוראות ושיחות רב-תוריות.

  • תרגום דיבור חי ב-Translate תומך ב-70+ שפות, שומר על טון הדובר ומתמודד עם רעש.

  • לקוחות כמו Shopify ו-UWM מדווחים על תוצאות עסקיות מרשימות עם המודל.

  • זמין כעת ב-Vertex AI, AI Studio, Gemini Live ו-Search Live.

האם דמיינתם פעם שיחה טבעית לחלוטין עם בינה מלאכותית, כאילו מדובר באדם אמיתי? גוגל מציגה שדרוג משמעותי למודל Gemini 2.5 Flash Native Audio, שמביא עידן חדש של אינטראקציות קוליות חכמות. השדרוג משפר את היכולת להתמודד עם זרימות עבודה מורכבות, להבין הוראות משתמשים ולנהל שיחות רציפות. כעת, המודל זמין ב-Google AI Studio, Vertex AI, Gemini Live ו-Search Live, ומאפשר בניית סוכני שירות לקוחות מתקדמים. השדרוג מתמקד בשלושה תחומים מרכזיים: קריאת פונקציות מדויקת יותר, מעקב אחר הוראות מורכבות ושיחות רב-תוריות חלקות יותר. על פי גוגל, המודל מצליח ב-71.5% במבחן ComplexFuncBench Audio לביצוע פונקציות מרובות שלבים, ומשיג 90% נאמנות להוראות מפתחים – עלייה מ-84%. זה אומר שהמודל יכול לשלב מידע בזמן אמת בתגובה קולית מבלי לשבור את זרימת השיחה, מה שמקל על פיתוח אפליקציות עסקיות. במקביל, גוגל משיקה יכולת תרגום דיבור חי בזמן אמת באפליקציית Google Translate. המערכת תומכת ביותר מ-70 שפות וב-2000 זוגות שפות, שומרת על אינטונציה, קצב וטון הדובר, ומתמודדת עם רעש סביבתי. היא מזהה שפות אוטומטית ומאפשרת שיחות דו-כיווניות, כמו שיחה באנגלית עם דובר הינדי שמתורגמת מיידית לאוזניות. הבטא זמינה כעת למכשירי אנדרואיד בארה"ב, מקסיקו והודו, עם תמיכה ב-iOS ובאזורים נוספים בקרוב. השיפורים הללו מגיעים בעקבות עדכון קודם למודלי Text-to-Speech של Gemini 2.5 Pro ו-Flash, שמאפשרים שליטה גבוהה יותר ביצירת דיבור רגשי. לקוחות כמו Shopify מדווחים כי משתמשים שוכחים שהם מדברים עם AI תוך דקה, ו-United Wholesale Mortgage הצליחו לייצר 14,000 הלוואות באמצעות המודל. Newo.ai משתמשים בו לקליטות שמזהות דובר ראשי בסביבה רועשת ומחליפות שפות באמצע שיחה. בעולם העסקי, השדרוג הזה פותח אפשרויות חדשות לסוכני שירות לקוחות, עיבוד משכנתאות ותקשורת גלובלית. בישראל, שבה חברות טק רבות משלבות AI בשירותים, זה יכול לשפר משמעותית את חוויית הלקוח. בהשוואה למתחרים, Gemini 2.5 Native Audio מוביל במבחנים, ומציע ביצועים גבוהים יותר בשיחות מורכבות. השילוב עם Vertex AI מאפשר פריסה מהירה בעסקים גדולים, בעוד Google AI Studio מקל על מפתחים להתחיל מיד. לקראת 2026, גוגל מתכננת להרחיב את התרגום ל-Gemini API, מה שייצור הזדמנויות חדשות לפיתוח אפליקציות רב-לשוניות. עבור מנהלי עסקים ישראלים, השאלה היא: איך תשלבו סוכני קול כאלה כדי להפחית עלויות שירות ולהגביר שביעות רצון? השדרוג מדגיש את החשיבות של AI קולי בעידן הדיגיטלי. בקיצור, Gemini 2.5 Native Audio הופך שיחות AI לטבעיות יותר, עם פוטנציאל לשנות את עולם השירותים והתקשורת. התחילו לבדוק עכשיו ב-Google AI Studio.

שאלות ותשובות

שאלות נפוצות

אהבתם את הכתבה?

הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל

עוד כתבות שיעניינו אותך

לכל הכתבות