דלג לתוכן הראשי
אוטומציות AI - לוגו
  • דף הבית
  • בלוג
  • חדשות
  • אודות
  • צור קשר
03-7630715קבעו ייעוץ חינם
אוטומציות AI - פתרונות אוטומציה וסוכני AI לעסקים בישראל

בונים סוכני AI ואוטומציות לעסקים בישראל: וואטסאפ, CRM, לידים, תורים, חשבוניות, דשבורדים וחיבור מערכות.

IL03-7630715USA(646) 760-4854info@automaziot.ai
אחד העם 9, תל אביב. מגדל שלום

קישורים מהירים

  • דף הבית
  • בלוג
  • חדשות
  • אודות
  • צור קשר
  • סיפורי הצלחה
  • מילון מונחים

הפתרונות שלנו

  • ניהול לידים אוטומטי
  • סוכן חכם לוואטסאפ
  • חיבור מערכות ודשבורדים
  • ניהול לקוחות חכם
  • קביעת תורים אוטומטית
  • מכירות ושירות לקוחות
  • אוטומציה לאיקומרס
  • סוכני AI
  • ייעוץ אוטומציה

הישארו מעודכנים

הירשמו לניוזלטר וקבלו עדכונים על חידושים בעולם האוטומציה וה-AI

FacebookInstagramLinkedIn

אתר זה משתמש ב-Google Analytics ו-Vercel Analytics לשיפור השירות. למידע מלא ראה מדיניות פרטיות

© 2026 אוטומציות AI. כל הזכויות שמורות.

מדיניות פרטיותתנאי שימושהצהרת נגישותמדיניות עריכה
יישור נטיות התנהגות ב-LLM: מה זה אומר | Automaziot
יישור נטיות התנהגות ב-LLM: למה מודלים עדיין בטוחים מדי
ביתחדשותיישור נטיות התנהגות ב-LLM: למה מודלים עדיין בטוחים מדי
מחקר

יישור נטיות התנהגות ב-LLM: למה מודלים עדיין בטוחים מדי

מחקר Google על 25 מודלים מצא פערי שיפוט מול בני אדם — גם כשהקונצנזוס האנושי נמוך מ-60%

צוות אוטומציות AIצוות אוטומציות AI
3 באפריל 2026
6 דקות קריאה

תגיות

Google ResearchGoogleAmir TaubenfeldZorik GekhmanLior NezryIRIERQLLM-as-a-judgeAnthropic Claude 4 SonnetGoogle Gemini 3 ProOpenAI GPT 5.1Mistral LargeDeepSeek R1WhatsApp Business APIZoho CRMN8NMcKinseyGartnerHubSpotMonday

נושאים קשורים

#מודלי שפה גדולים#WhatsApp Business API ישראל#Zoho CRM#אוטומציה עם N8N#שירות לקוחות מבוסס AI#מדידת סיכוני AI
מבוסס על כתבה שלGoogle Research ↗·תרגום, סיכום והקשר עסקי על-ידי המערכתאיך אנחנו עובדים

✨תקציר מנהלים

נקודות עיקריות

  • Google בחנה 25 מודלי שפה מול 550 משתתפים אנושיים ו-10 מתייגים לכל תרחיש.

  • מודלים מעל 120B התקרבו ליישור גבוה רק במצבי קונצנזוס של 10 מתוך 10.

  • במקרי הסכמה נמוכה של 50%-60%, כל המודלים הראו ביטחון יתר במקום לשקף עמימות.

  • לעסקים בישראל, חיבור LLM ל-WhatsApp, Zoho CRM ו-N8N מחייב כללי הסלמה ובקרה אנושית.

  • פיילוט בסיסי למדידת התנהגות מודל יכול להתחיל בעלות של כ-₪500 עד ₪2,000 בחודש.

יישור נטיות התנהגות ב-LLM: למה מודלים עדיין בטוחים מדי

  • Google בחנה 25 מודלי שפה מול 550 משתתפים אנושיים ו-10 מתייגים לכל תרחיש.
  • מודלים מעל 120B התקרבו ליישור גבוה רק במצבי קונצנזוס של 10 מתוך 10.
  • במקרי הסכמה נמוכה של 50%-60%, כל המודלים הראו ביטחון יתר במקום לשקף עמימות.
  • לעסקים בישראל, חיבור LLM ל-WhatsApp, Zoho CRM ו-N8N מחייב כללי הסלמה ובקרה אנושית.
  • פיילוט בסיסי למדידת התנהגות מודל יכול להתחיל בעלות של כ-₪500 עד ₪2,000 בחודש.

יישור נטיות התנהגות ב-LLM והמשמעות לעסקים

יישור נטיות התנהגות ב-LLM הוא מדד לשאלה עד כמה מודל שפה פועל כמו בני אדם במצבי שיפוט חברתיים. במחקר של Google על 25 מודלים, גם מודלים חזקים הגיעו רק לרמות יישור של שנות ה-80 הנמוכות עד האמצעיות כשלא היה קונצנזוס אנושי כמעט מלא. עבור עסקים בישראל זו לא שאלה אקדמית בלבד: אם עוזר מבוסס GPT, Gemini או Claude מייעץ ללקוח, לנציג שירות או לעובד, הטון והבחירה בין איפוק, אסרטיביות או פעולה מיידית עלולים להשפיע על מכירה, תלונה או סיכון משפטי. לפי McKinsey, ארגונים שכבר מטמיעים בינה מלאכותית גנרטיבית מעבירים יותר משימות קו-ראשון למכונות, ולכן איכות השיפוט חשובה לא פחות מדיוק עובדתי.

מה זה יישור נטיות התנהגות ב-LLM?

יישור נטיות התנהגות ב-LLM הוא התאמה בין הנטייה ההתנהגותית שהמודל מבטא בתשובותיו לבין העדפות אנושיות במצבים חברתיים ומקצועיים. בהקשר עסקי, המשמעות היא האם עוזר דיגיטלי ימליץ ללקוח להירגע, להתעקש, לבדוק פרטים או לפעול מיד — בהתאם למה שרוב בני האדם היו בוחרים. לדוגמה, במוקד שירות של קליניקה פרטית בישראל, תשובה אסרטיבית מדי ב-WhatsApp עלולה להסלים שיחה תוך דקות. לפי המחקר, כל תרחיש נבדק מול 10 מתייגים אנושיים, ולכן אפשר למדוד גם קונצנזוס וגם סטייה ממנו.

מה Google בדקה בפועל במחקר על התנהגות מודלים

לפי הדיווח של Google Research, החוקרים בנו מסגרת הערכה שממירה שאלונים פסיכולוגיים מבוססים, כמו IRI לאמפתיה ו-ERQ לוויסות רגשי, לתרחישי Situational Judgment Tests. במקום לשאול את המודל מה הוא "חושב על עצמו", הם הציבו אותו בתוך סיטואציות יומיומיות ועבודתיות עם שתי דרכי פעולה אפשריות. כל תרחיש נבדק בידי 3 מתייגים עצמאיים כדי לוודא שהוא קוהרנטי ומשקף את הנטייה ההתנהגותית הרלוונטית. זה חשוב, משום שהמחקר מנסה למדוד התנהגות נגלית ולא רק הצהרה עצמית.

בהמשך, Google השוותה את תשובות המודלים להעדפות אנושיות שנאספו מ-10 מתייגים לכל תרחיש מתוך מאגר של 550 משתתפים. המחקר בחן 25 מודלי שפה גדולים וזיהה שני סוגי פערים: סטייה מכיוון הקונצנזוס במקרים של הסכמה גבוהה, ואי-ייצוג של מגוון הדעות כאשר ההסכמה האנושית חלשה. לפי הממצאים, מודלים קטנים מ-25B הראו יישור נמוך משמעותית, לעיתים קרוב לרמת ניחוש. לעומתם, מודלים גדולים מעל 120B ומודלים סגורים מהשורה הראשונה התקרבו ליישור כמעט מושלם רק כאשר הייתה תמימות דעים של 10 מתוך 10.

איפה המודלים עדיין נכשלים

לפי הניתוח האיכותני שפורסם, מודלים נטו לעודד פתיחות רגשית במצבים מקצועיים שבהם בני אדם העדיפו איפוק. בסכסוכים חברתיים הם נטו לבחור בהרמוניה במקום עמידה על עיקרון, בניגוד להעדפות המשתתפים. בנוסף, בחלק מהמקרים הם הפגינו אימפולסיביות גבוהה יותר מבני אדם, למשל בהמלצה לפעול מיד במקום לבצע בדיקה לוגיסטית. עבור עסק שמפעיל סוכן וואטסאפ או נציג שירות מבוסס LLM, זה הבדל מהותי: תגובה אחת פזיזה יכולה לעלות בליד אבוד, בזיכוי מיותר או בהסלמת שיחה מול לקוח תוך פחות מ-5 דקות.

למה ביטחון יתר של מודלים הוא הסיפור הגדול באמת

החלק החשוב ביותר במחקר אינו רק האם המודל "צודק", אלא האם הוא יודע מתי לא להיות בטוח. Google מראה שבתרחישים עם קונצנזוס אנושי נמוך, למשל 50% עד 60% הסכמה בלבד, כל 25 המודלים שנבדקו שמרו על רמת ביטחון גבוהה מדי בהחלטה שלהם. במילים פשוטות: במקום לשקף עמימות אנושית, המודל תופס עמדה. זה מתחבר למגמה רחבה יותר. לפי דוח Gartner, עד 2026 יותר ממחצית מפרויקטי הבינה הגנרטיבית הארגונית יידרשו למנגנוני governance, ניטור והגדרת סיכון. הסיבה ברורה: בארגון, תשובה בטוחה מדי אך לא מאוזנת מסוכנת יותר מתשובה מהוססת.

ניתוח מקצועי: למה זה קריטי בהטמעה אמיתית

מניסיון בהטמעה אצל עסקים ישראליים, המשמעות האמיתית כאן היא לא "אישיות" של המודל אלא בקרת החלטה. ברגע שמחברים מודל שפה ל-WhatsApp Business API, ל-Zoho CRM או לתהליך ב-N8N, הנטייה ההתנהגותית שלו הופכת לפעולה עסקית: שליחת הודעת מעקב, ניסוח תשובה ללקוח כועס, תעדוף ליד, או המלצה לנציג אם להציע פיצוי. אם המודל בטוח מדי כשבני אדם עצמם חלוקים, הוא לא רק מנסח טקסט — הוא דוחף את התהליך לכיוון מסוים. כאן בדיוק נדרש תכנון שכבות: כללי החלטה קשיחים ב-N8N, שדות בקרה ב-Zoho CRM, ואפשרות הסלמה לאדם במצבים רגישים. להערכתי, בתוך 12 עד 18 חודשים נראה יותר ארגונים שמפסיקים למדוד רק דיוק תשובה ומתחילים למדוד "התאמה התנהגותית לתהליך". זה יהיה חשוב במיוחד במכירות, שירות, גבייה ותיאום, שבהם הטון משפיע ישירות על המרה ושימור.

ההשלכות לעסקים בישראל

המשמעות לשוק הישראלי מוחשית מאוד. במשרדי עורכי דין, סוכן מבוסס LLM שמרכך יותר מדי עמדת לקוח עלול לפגוע באיסוף מידע מדויק; אצל סוכני ביטוח, תגובה בטוחה מדי ללא הדגשת חריגים עלולה לייצר ציפייה שגויה; במרפאות פרטיות, אמפתיה גבוהה מדי בלי גבול תפעולי יכולה להאריך שיחות וליצור עומס מזכירות; ובנדל"ן, דחיפה מהירה מדי לפעולה יכולה לפספס בדיקת מסמכים. בישראל, שבה חלק גדול מהאינטראקציה העסקית עובר דרך WhatsApp, ההבדלים האלו מורגשים מהר יותר מאשר במייל או בטופס אתר.

יש גם שכבת רגולציה ויישום מקומית. תחת חוק הגנת הפרטיות בישראל, עסק צריך להגדיר מה נאסף, מי רואה, ומה נשמר במערכת. אם מודל מנתח שיחה ומחליט על תגובה, רצוי שהלוגיקה התפעולית לא תהיה מוסתרת בתוך המודל בלבד. לכן נכון לבנות תהליך שבו ה-LLM מנסח, אבל N8N קובע תנאים, ו-Zoho CRM מחזיק סטטוסים, הרשאות ותיעוד. פרויקט בסיסי של הטמעת זרימת שירות עם WhatsApp, CRM ואוטומציה יכול להתחיל בטווח של כ-₪3,500 עד ₪12,000 לעסק קטן, תלוי במספר התרחישים ובכמות החיבורים. מי שרוצה להרחיב מעבר לניסוי צריך לשקול מערכת CRM חכמה יחד עם מדיניות הסלמה ברורה לאדם. כאן היתרון של חיבור AI Agents + WhatsApp Business API + Zoho CRM + N8N בולט במיוחד, משום שהוא מאפשר לא רק לייצר תשובה אלא לשלוט בהתנהגות העסקית שלה.

מה לעשות עכשיו: בדיקת הטיות התנהגות ב-LLM בעסק

  1. בדקו באילו נקודות המודל שלכם נותן ייעוץ, לא רק מידע — למשל שירות, מכירות, גבייה או תיאום.
  2. הריצו פיילוט של שבועיים עם 20 עד 30 תרחישים אמיתיים והשוו בין תשובת המודל להעדפת 3 עובדים לפחות.
  3. הגדירו ב-N8N כללי עצירה: מתי להעביר לאדם, מתי לאשר אוטומטית, ומתי רק לנסח טיוטה.
  4. ודאו שה-CRM שלכם, כמו Zoho, HubSpot או Monday, שומר תיעוד של תשובה, תיקון אנושי ותוצאת השיחה. עלות כלי פיילוט כזו נעה לעיתים בין ₪500 ל-₪2,000 בחודש, לפני פיתוח מותאם.

מבט קדימה על יישור התנהגותי של מודלי שפה

המחקר של Google הוא צעד מוקדם, אבל הוא מחדד נקודה חשובה: הבעיה הבאה של עסקים עם בינה מלאכותית לא תהיה רק הזיות, אלא גם שיפוט בטוח מדי במצבים אנושיים מעורפלים. ב-12 החודשים הקרובים כדאי לעקוב אחרי כלי evaluation שיבדקו לא רק נכונות, אלא גם איפוק, אסרטיביות ועמימות. עבור עסקים בישראל, התגובה הנכונה תהיה שילוב מדוד של AI Agents, WhatsApp, CRM ו-N8N — עם אדם בתוך הלולאה בתרחישים רגישים.

שאלות ותשובות

שאלות נפוצות

רוצים ליישם את זה בעסק שלכם?

באוטומציות AI אנחנו בונים סוכני AI ואוטומציות לעסקים בישראל. ראו את השירותים הרלוונטיים:

  • אוטומציה לעסקיםחיבור מערכות, חשבוניות ודשבורדים
  • בוט וואטסאפ לעסקWhatsApp Business API בישראל
  • סוכני AI לעסקיםסוכנים שמטפלים בלידים, שיחות ו-CRM
  • ניהול לידים אוטומטימענה מיידי, ניקוד וסינון אוטומטי

הכתבה הוכנה על-ידי המערכת בליווי בינה מלאכותית: תרגום, סיכום והוספת הקשר עסקי ישראלי מתוך פרסום מקורי של Google Research. קראו על תהליך העריכה שלנו. קישור למקור המקורי.

אהבתם את הכתבה?

הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל

עוד מ־Google Research

כל הכתבות מ־Google Research
אימות מחיקת מידע ממודלי בינה מלאכותית: פריצת הדרך של גוגל
מחקר
לפני 2 ימים
5 דקות
·מ־Google Research

אימות מחיקת מידע ממודלי בינה מלאכותית: פריצת הדרך של גוגל

חוקרי Google Research הציגו בוועידת AISTATS 2026 מסגרת עבודה מהפכנית בשם Regularized f-Divergence Kernel Tests, המיועדת לבצע אימות מחיקת מידע ממודלי בינה מלאכותית. השיטה החדשה מתגברת על כשלי הבדיקות הדו-מדגמיות המסורתיות (כמו MMD), ומאפשרת למבקרים חיצוניים לזהות דליפות מידע מקומיות ברמת דיוק חסרת תקדים. באמצעות שימוש במדדי שונות מתקדמים כמו Hockey-stick divergence ורגולריזציה של ליבות, המערכת מזהה הפרות פרטיות תוך שימוש בכמה אלפי דגימות בלבד בהשוואה למיליוני דגימות שנדרשו בעבר בשיטות כמו DP-Auditorium. פיתוח זה מעניק לעסקים הפועלים תחת רגולציות פרטיות מחמירות כלי מתמטי מוכח להבטחת עמידה בדרישות החוק.

AISTATS 2026Mónica RiberoAntonin Schrab
קרא עוד
גוגל חושפת את טכנולוגיית Agentic RAG לעסקים: דיוק חסר תקדים ל-AI
מחקר
5 ביוני 2026
4 דקות
·מ־Google Research

גוגל חושפת את טכנולוגיית Agentic RAG לעסקים: דיוק חסר תקדים ל-AI

גוגל מציגה את Agentic RAG, ארכיטקטורת רב-סוכנים חדשה המשולבת בפלטפורמת Gemini Enterprise. בניגוד למערכות RAG מסורתיות המחזירות תשובות חלקיות כאשר המידע מבוזר, המנגנון החדש פועל בצורה איטרטיבית. המערכת מחלקת את השאילתה בין סוכנים מומחים (כמו סוכן תכנון וסוכן ניסוח מחדש) ומשתמשת ב'סוכן הקשר מספק' המבצע בקרת איכות קפדנית על תוצאות החיפוש. בבדיקות של גוגל על מאגר המידע FramesQA, המערכת הגיעה ל-90.1% דיוק בחיפושים מורכבים חוצי-מאגרים, תוך שמירה על מהירות מענה כמעט זהה (פגיעה של 3% בלבד בלייטנסי). הטכנולוגיה, הזמינה כעת בגרסת תצוגה מקדימה, פותחת עידן חדש של אמינות ודיוק עבור סוכני AI בארגונים.

Google CloudGemini Enterprise Agent PlatformFramesQA
קרא עוד
מודל בינה מלאכותית לחיזוי שיטפונות: גוגל משחררת את קוד המקור
מחקר
3 ביוני 2026
5 דקות
·מ־Google Research

מודל בינה מלאכותית לחיזוי שיטפונות: גוגל משחררת את קוד המקור

חוקרי Google Research שחררו רשמית את מודל ההידרולוגיה של החברה כקוד פתוח תחת רישיון Apache 2.0. המערכת, המבוססת על ספריית PyTorch ורשתות ME-LSTM, מניעה את חיזויי הזמן האמת של פלטפורמת Flood Hub הגלובלית. המהלך מאפשר לרשויות מטרולוגיות, חברות מים וגופי תשתית להריץ ולעבד נתוני אקלים ומשקעים מקומיים באופן עצמאי ומאובטח על שרתי הארגון. שילוב המודל, שנבחן בשיתוף פעולה עם המכון ההידרומטאורולוגי הצ'כי, מאפשר להאריך את טווח התחזית האמינה בעד שישה ימים באגנים מנוטרים, ומציע לעסקים ולרשויות בישראל כלי רב-עוצמה לניהול סיכוני מזג אוויר ושיפור ההיערכות לאירועי קיצון.

GoogleGitHubPyTorch
קרא עוד
הכרזות גוגל I/O 2026: המעבר לעידן של סוכני בינה מלאכותית אוטונומיים
חדשות
28 במאי 2026
5 דקות
·מ־Google Research

הכרזות גוגל I/O 2026: המעבר לעידן של סוכני בינה מלאכותית אוטונומיים

כנס גוגל I/O 2026 סימן את המעבר הרשמי של התעשייה ל"עידן הסוכנים" (Agentic Era), בו מערכות בינה מלאכותית פועלות באופן אוטונומי לביצוע משימות הנדסה ומחקר מורכבות. לפי דיווח החברה, גוגל השיקה כלים מרובי-סוכנים המסוגלים לבנות מערכות תוכנה שלמות מאפס. בנוסף לפיתוחי התוכנה, גוגל הציגה פריצות דרך במחקר רפואי עם מודל ה-MedGemma הפתוח (שחצה 5 מיליון הורדות), כלים מבוססי AI לחיזוי אקלים, ואת לוח הפיתוח Coralboard לעיבוד נתונים ישירות בציוד קצה. במוקד ההכרזות עמד השבב הקוונטי Willow, שלפי הנתונים מהיר פי 13,000 ממחשבי-על קלאסיים באלגוריתמים ספציפיים. חידושים אלו פותחים דלת לחברות ולסטארט-אפים בישראל לאמץ תהליכי אוטומציה עמוקים יותר.

Google I/O 2026GeminiMedGemma
קרא עוד

עוד כתבות שיעניינו אותך

לכל הכתבות
אימות מחיקת מידע ממודלי בינה מלאכותית: פריצת הדרך של גוגל
מחקר
לפני 2 ימים
5 דקות
·מ־Google Research

אימות מחיקת מידע ממודלי בינה מלאכותית: פריצת הדרך של גוגל

חוקרי Google Research הציגו בוועידת AISTATS 2026 מסגרת עבודה מהפכנית בשם Regularized f-Divergence Kernel Tests, המיועדת לבצע אימות מחיקת מידע ממודלי בינה מלאכותית. השיטה החדשה מתגברת על כשלי הבדיקות הדו-מדגמיות המסורתיות (כמו MMD), ומאפשרת למבקרים חיצוניים לזהות דליפות מידע מקומיות ברמת דיוק חסרת תקדים. באמצעות שימוש במדדי שונות מתקדמים כמו Hockey-stick divergence ורגולריזציה של ליבות, המערכת מזהה הפרות פרטיות תוך שימוש בכמה אלפי דגימות בלבד בהשוואה למיליוני דגימות שנדרשו בעבר בשיטות כמו DP-Auditorium. פיתוח זה מעניק לעסקים הפועלים תחת רגולציות פרטיות מחמירות כלי מתמטי מוכח להבטחת עמידה בדרישות החוק.

AISTATS 2026Mónica RiberoAntonin Schrab
קרא עוד
למידה מונחית בינה מלאכותית: המחקר החדש של Google DeepMind
מחקר
לפני 3 ימים
4 דקות
·מ־DeepMind

למידה מונחית בינה מלאכותית: המחקר החדש של Google DeepMind

מחקר מבוקר רחב-היקף (RCT) שפורסם על ידי Google DeepMind בשיתוף עם משרד החינוך של סיירה לאון וארגון Fab AI מציג תוצאות פורצות דרך בשילוב בינה מלאכותית בלמידה. הניסוי, שנערך בקרב 1,763 תלמידים לאורך שמונה שבועות, בחן את מודל "הלמידה המונחית" (Guided Learning) המבוסס על Gemini. התוצאות הראו שיפור הישגים ממוצע של 0.258 סטיות תקן במתמטיקה – נתון המקביל לעד 2.5 שנות לימוד בכיתות שבהן המורים שילבו את הכלי באופן אינטנסיבי. במקום לשמש כמנוע תשובות פשוט, המודל הונחה לפעול בשיטה סוקרטית, ושלח שאלות מכוונות ב-76% מהאינטראקציות, בעוד שפתרונות ישירים סופקו ב-2% בלבד מהמקרים. המחקר מדגיש את הפוטנציאל העצום של סוכני AI מבוססי פדגוגיה בעיצוב מחדש של הדרכות והכשרות גם במגזר העסקי.

Google DeepMindGeminiFab AI
קרא עוד
פרצות אבטחה במערכות בינה מלאכותית: איומי האוטומציה החדשים
מחקר
לפני 6 ימים
5 דקות
·מ־Wired

פרצות אבטחה במערכות בינה מלאכותית: איומי האוטומציה החדשים

המעבר המהיר לאוטומציה ושילוב בינה מלאכותית חושף עסקים לפרצות אבטחה חסרות תקדים. דוח אבטחה מקיף של מגזין WIRED חושף כיצד האקרים ניצלו את מערכת התמיכה המבוססת AI של Meta להשתלטות על חשבונות ידוענים, וכיצד כלי ה-AI העוצמתי של Anthropic, המכונה Mythos, משמש את ה-NSA למטרות תקיפה. הדו"ח מדגיש את הסיכון שביישומי בינה מלאכותית ומזהיר את המגזר העסקי מפני הסתמכות עיוורת על כלים אוטונומיים ללא מנגנוני אימות קפדניים.

MetaChainalysisAnthropic
קרא עוד
גוגל חושפת את טכנולוגיית Agentic RAG לעסקים: דיוק חסר תקדים ל-AI
מחקר
5 ביוני 2026
4 דקות
·מ־Google Research

גוגל חושפת את טכנולוגיית Agentic RAG לעסקים: דיוק חסר תקדים ל-AI

גוגל מציגה את Agentic RAG, ארכיטקטורת רב-סוכנים חדשה המשולבת בפלטפורמת Gemini Enterprise. בניגוד למערכות RAG מסורתיות המחזירות תשובות חלקיות כאשר המידע מבוזר, המנגנון החדש פועל בצורה איטרטיבית. המערכת מחלקת את השאילתה בין סוכנים מומחים (כמו סוכן תכנון וסוכן ניסוח מחדש) ומשתמשת ב'סוכן הקשר מספק' המבצע בקרת איכות קפדנית על תוצאות החיפוש. בבדיקות של גוגל על מאגר המידע FramesQA, המערכת הגיעה ל-90.1% דיוק בחיפושים מורכבים חוצי-מאגרים, תוך שמירה על מהירות מענה כמעט זהה (פגיעה של 3% בלבד בלייטנסי). הטכנולוגיה, הזמינה כעת בגרסת תצוגה מקדימה, פותחת עידן חדש של אמינות ודיוק עבור סוכני AI בארגונים.

Google CloudGemini Enterprise Agent PlatformFramesQA
קרא עוד