דלג לתוכן הראשי
אוטומציות AI - לוגו
  • דף הבית
  • בלוג
  • חדשות
  • אודות
  • צור קשר
03-7630715קבעו ייעוץ חינם
אוטומציות AI - פתרונות אוטומציה וסוכני AI לעסקים בישראל

בונים סוכני AI ואוטומציות לעסקים בישראל: וואטסאפ, CRM, לידים, תורים, חשבוניות, דשבורדים וחיבור מערכות.

IL03-7630715USA(646) 760-4854info@automaziot.ai
אחד העם 9, תל אביב. מגדל שלום

קישורים מהירים

  • דף הבית
  • בלוג
  • חדשות
  • אודות
  • צור קשר
  • סיפורי הצלחה
  • מילון מונחים

הפתרונות שלנו

  • ניהול לידים אוטומטי
  • סוכן חכם לוואטסאפ
  • חיבור מערכות ודשבורדים
  • ניהול לקוחות חכם
  • קביעת תורים אוטומטית
  • מכירות ושירות לקוחות
  • אוטומציה לאיקומרס
  • סוכני AI
  • ייעוץ אוטומציה

הישארו מעודכנים

הירשמו לניוזלטר וקבלו עדכונים על חידושים בעולם האוטומציה וה-AI

FacebookInstagramLinkedIn

אתר זה משתמש ב-Google Analytics ו-Vercel Analytics לשיפור השירות. למידע מלא ראה מדיניות פרטיות

© 2026 אוטומציות AI. כל הזכויות שמורות.

מדיניות פרטיותתנאי שימושהצהרת נגישותמדיניות עריכה
ReasoningBank לסוכני AI: מה זה אומר לעסקים | Automaziot
ReasoningBank לסוכני AI מתמשכים: איך זיכרון כישלונות משפר ביצועים
ביתחדשותReasoningBank לסוכני AI מתמשכים: איך זיכרון כישלונות משפר ביצועים
ניתוח

ReasoningBank לסוכני AI מתמשכים: איך זיכרון כישלונות משפר ביצועים

המחקר של Google Cloud מציג שיפור של 8.3% ב-WebArena — ומה עסקים בישראל צריכים לבדוק כבר עכשיו

צוות אוטומציות AIצוות אוטומציות AI
21 באפריל 2026
6 דקות קריאה

תגיות

Google CloudReasoningBankICLRGemini-2.5-FlashWebArenaSWE-Bench-VerifiedReActVanilla ReActSynapseAWMLLM-as-a-judgeMaTTSWhatsApp Business APIZoho CRMN8NOpenAIAnthropicHubSpotMondayMcKinseyGartner

נושאים קשורים

#זיכרון לסוכני AI#WhatsApp Business API ישראל#Zoho CRM לעסקים#N8N אוטומציה#סוכני AI לשירות לקוחות#אוטומציה למרפאות
מבוסס על כתבה שלGoogle Research ↗·תרגום, סיכום והקשר עסקי על-ידי המערכתאיך אנחנו עובדים

✨תקציר מנהלים

נקודות עיקריות

  • לפי Google Cloud, ReasoningBank שיפר ב-8.3% את WebArena וב-4.6% את SWE-Bench-Verified מול Vanilla ReAct.

  • המסגרת לא שומרת רק פעולות, אלא לקחים נימוקיים מובנים: כותרת, תיאור ותוכן אסטרטגי לכל זיכרון.

  • עם MaTTS ו-scaling factor של k=5 נרשם שיפור נוסף של 3% ב-WebArena לצד 0.4 צעדים פחות למשימה.

  • לעסקים בישראל, הערך גדול במיוחד בענפים עם 300-800 פניות חודשיות כמו מרפאות, נדל"ן ומשרדי עורכי דין.

  • היישום הפרקטי דורש חיבור בין WhatsApp Business API, Zoho CRM, N8N וסוכן AI שמסווג גם הצלחות וגם כשלים.

ReasoningBank לסוכני AI מתמשכים: איך זיכרון כישלונות משפר ביצועים

  • לפי Google Cloud, ReasoningBank שיפר ב-8.3% את WebArena וב-4.6% את SWE-Bench-Verified מול Vanilla ReAct.
  • המסגרת לא שומרת רק פעולות, אלא לקחים נימוקיים מובנים: כותרת, תיאור ותוכן אסטרטגי לכל זיכרון.
  • עם MaTTS ו-scaling factor של k=5 נרשם שיפור נוסף של 3% ב-WebArena לצד 0.4 צעדים...
  • לעסקים בישראל, הערך גדול במיוחד בענפים עם 300-800 פניות חודשיות כמו מרפאות, נדל"ן ומשרדי עורכי...
  • היישום הפרקטי דורש חיבור בין WhatsApp Business API, Zoho CRM, N8N וסוכן AI שמסווג גם...

ReasoningBank לסוכני AI מתמשכים: למה זיכרון תפעולי נהיה שכבת חובה

ReasoningBank הוא מסגרת זיכרון לסוכני AI שמאפשרת להם ללמוד גם מהצלחות וגם מכישלונות אחרי העלייה לאוויר. לפי Google Cloud, בגישת הבנצ'מרק שפורסמה נרשם שיפור של 8.3% ב-WebArena ו-4.6% ב-SWE-Bench-Verified לעומת סוכן ללא זיכרון.

זה חשוב עכשיו משום שיותר עסקים עוברים מניסוי חד-פעמי לסוכן שפועל לאורך ימים ושבועות: עונה ללקוחות, מחפש מידע, מסווג פניות או מסייע לצוותי פיתוח. ברגע שסוכן כזה חוזר שוב ושוב על אותה טעות, העלות העסקית הופכת מוחשית מאוד. לפי McKinsey, ארגונים כבר מרחיבים שימוש בבינה מלאכותית גנרטיבית לתהליכי ליבה, ולכן שכבת זיכרון אינה עוד תוספת נחמדה אלא רכיב תפעולי.

מה זה זיכרון נימוקי לסוכן AI?

זיכרון נימוקי לסוכן AI הוא מאגר מסודר של אסטרטגיות, לקחים ושיקולי החלטה שהסוכן שולף לפני פעולה חדשה. בהקשר עסקי, המטרה אינה לשמור כל קליק או כל קריאת API, אלא לתמצת עקרונות שניתנים להעברה בין משימות. לדוגמה, במקום לזכור רק שנציג דיגיטלי לחץ על כפתור מסוים באתר, הוא שומר כלל כמו "לאמת מזהה עמוד לפני גלילה כדי להימנע ממלכודת pagination". לפי Google, כל פריט זיכרון כולל כותרת, תיאור ותוכן נימוקי מובנה.

מה Google Cloud הציגה במחקר ReasoningBank

לפי הדיווח של Google Cloud, ReasoningBank נועד לפתור חולשה מרכזית של סוכנים: אחרי הפריסה, הם מתקשים לנתח את מה שעבד ומה שנכשל ולשפר את עצמם בזמן אמת. המחקר, שהוצג במסגרת מאמר ל-ICLR, משווה את הגישה החדשה למספר חלופות, בהן Vanilla ReAct ללא זיכרון, Synapse עם Trajectory Memory ו-AWM עם Workflow Memory. הטענה המרכזית היא שזיכרון שמבוסס רק על רצף פעולות מפספס את הרמה האסטרטגית, וזיכרון שמבוסס רק על הצלחות מפספס את מקור הלמידה החשוב ביותר: הכישלון.

לפי הנתונים שפורסמו, ReasoningBank פועל בלולאה סגורה של שליפה, חילוץ וקונסולידציה. לפני פעולה, הסוכן שולף זיכרונות רלוונטיים; לאחר מכן הוא פועל בסביבה, ומעריך את מסלול הפעולה באמצעות LLM-as-a-judge. משם הוא מחלץ תובנות הצלחה או רפלקציה על כישלון ומוסיף אותן לבנק הזיכרון. Google מציינת שהמערכת עמידה יחסית לרעש בשיפוט. במבחנים על WebArena ו-SWE-Bench-Verified עם Gemini-2.5-Flash, היא שיפרה שיעורי הצלחה וחסכה כמעט 3 צעדים למשימה ב-SWE-Bench-Verified לעומת קו בסיס ללא זיכרון. למי שבונה סוכני AI לעסקים, זו אינדיקציה ברורה לכך שזיכרון איכותי משפיע גם על דיוק וגם על עלות הפעלה.

MaTTS: חיבור בין זיכרון להגדלת חישוב בזמן הרצה

החידוש השני במחקר הוא Memory-aware test-time scaling, או MaTTS. לפי Google, במקום להריץ כמה מסלולי חשיבה ולזרוק את כולם חוץ מהתשובה הסופית, המערכת ממנפת את מסלולי החיפוש עצמם כחומר לימוד. בגרסה המקבילית, הסוכן מייצר כמה trajectories עבור אותה שאלה; בגרסה הרציפה, הוא משפר בהדרגה את הנימוק באותו מסלול. כאשר Google הפעילה scaling factor של k=5, ReasoningBank עם MaTTS שיפר את שיעור ההצלחה בעוד 3% על WebArena והפחית עוד 0.4 צעדים למשימה לעומת ReasoningBank בלי MaTTS.

ההקשר הרחב: למה שוק הסוכנים זז מזיכרון פעולה לזיכרון אסטרטגי

המחקר של Google משתלב במעבר רחב יותר בשוק: מסוכנים שמבצעים פעולות נקודתיות לסוכנים שמנהלים תהליך רב-שלבי ומתמשך. כאן ההבדל בין "לשמור לוג" לבין "לשמור נימוק" הופך קריטי. ספקיות כמו OpenAI, Anthropic ו-Google דוחפות מודלים שמסוגלים להחזיק הקשר טוב יותר, אך הקשר לבדו לא יוצר למידה ארוכת טווח. לפי Gartner, עד 2028 חלק משמעותי מהחלטות התפעול בארגונים יעבור דרך מערכות סמי-אוטונומיות; המשמעות היא שכל טעות חוזרת בתהליך מכירה, שירות או תפעול תהפוך לעלות מצטברת. לכן שכבת reasoning memory עשויה להפוך למה ש-CRM היה למכירות לפני 15 שנה: לא מותרות, אלא תשתית.

ניתוח מקצועי: מה המשמעות האמיתית של ReasoningBank בשטח

מניסיון בהטמעה אצל עסקים ישראלים, המשמעות האמיתית כאן היא לא רק "סוכן חכם יותר", אלא מעבר מסוכן שמגיב לסוכן שבונה משמעת תפעולית. רוב הכשלים בפרויקטי AI עסקיים אינם נובעים ממודל חלש, אלא מחוסר עקביות: אותה פנייה נכנסת ב-WhatsApp, נרשמת חלקית ב-Zoho CRM, עוברת דרך N8N, ובשלב כלשהו נעלם ההקשר שהוביל להחלטה. אם מוסיפים שכבת זיכרון נימוקית, אפשר לשמר לא רק את התוצאה אלא גם את ההיגיון העסקי: מתי כדאי להסלים לנציג אנושי, איזה מסמך חסר לפני פתיחת תיק, ואילו סימנים מקדימים מעידים שליד מסוים אינו בשל.

מנקודת מבט של יישום בשטח, זה חשוב במיוחד כשמשלבים AI Agents עם WhatsApp Business API, Zoho CRM ו-N8N. לדוגמה, סוכן יכול ללמוד שכאשר לקוח שואל פעמיים על מחיר אך לא מוסר אימייל, יש להציע שיחת המשך במקום לשלוח הצעת מחיר מלאה. זו אינה "אוטומציה" במובן הגולמי, אלא מדיניות עבודה שנבנית מניסיון מצטבר. ההערכה שלי היא שבתוך 12 עד 18 חודשים, ספקים שיציעו רק prompt engineering בלי מנגנון זיכרון, בקרה ולקחי כישלון יתקשו להצדיק פרויקטים ארוכי טווח. הסוכנים המנצחים יהיו אלה שיודעים להסביר למה פעלו, לא רק מה עשו.

ההשלכות לעסקים בישראל: משרדי עורכי דין, מרפאות ונדל"ן

בישראל, הערך של ReasoningBank בולט במיוחד בענפים עם תהליך חזרתי והרבה חריגים. במשרדי עורכי דין, למשל, סוכן שמקבל פניות ראשוניות ב-WhatsApp יכול ללמוד אילו שאלות סינון לקצר, ואילו תשובות מחייבות העברה מיידית לעורך דין. במרפאות פרטיות, אותו עיקרון תקף לתיאום תורים, שליחת מסמכי הכנה ואימות זכאות. במשרדי תיווך ונדל"ן, הסוכן יכול לזכור אילו בקשות חוזרות מעידות על מתעניין רציני, ואילו שיחות נוטות להתבזבז על מידע שכבר זמין בדף הנכס. החיסכון כאן אינו סיסמה: בעסק קטן עם 300 עד 800 פניות בחודש, קיצור של 30 עד 60 שניות לכל פנייה מצטבר לעשרות שעות עבודה חודשיות.

יש גם שכבת רגולציה ותרבות מקומית. בישראל צריך לתכנן זיכרון סוכן כך שלא ישמור מידע רגיש ללא צורך, בהתאם לעקרונות חוק הגנת הפרטיות ולמדיניות פנימית של העסק. בנוסף, סוכן שפועל בעברית חייב להבין קיצורים, סלנג והודעות קוליות מתומללות, אחרת הזיכרון שהוא בונה יהיה רועש. מבחינת עלויות, פיילוט בסיסי שמשלב WhatsApp Business API, חיבור ל-Zoho CRM וזרימות N8N ינוע אצל עסקים קטנים סביב אלפי שקלים בודדים להקמה ועוד עלות חודשית קבועה עבור הודעות, API ותחזוקה. מי שבוחן מהלך כזה צריך לחשוב לא רק על מערכת CRM חכמה, אלא על השאלה איך הזיכרון של הסוכן מזין את ה-CRM ואיך ה-CRM מחזיר לו הקשר שימושי.

מה לעשות עכשיו: צעדים מעשיים להטמעת זיכרון לסוכן

  1. בדקו אם ה-CRM הקיים שלכם, כמו Zoho, HubSpot או Monday, מאפשר חיבור API לשדות מותאמים שישמרו "לקח פעולה" ולא רק סטטוס ליד.
  2. הריצו פיילוט של שבועיים על תהליך אחד בלבד — למשל מענה לוואטסאפ עסקי או סינון לידים — ומדדו 3 מדדים: שיעור הצלחה, זמן טיפול ממוצע ומספר העברות לנציג.
  3. הגדירו מראש אילו כישלונות ראויים להישמר כזיכרון: מסמך חסר, לקוח לא רלוונטי, שגיאת ניתוב, או חיפוש שיצא למסלול שגוי.
  4. בנו שכבת orchestration דרך N8N שמחברת בין WhatsApp Business API, מנוע ה-AI וה-CRM, כדי שהלקחים יישמרו במקום אחד ולא יתפזרו בין מערכות.

מבט קדימה: מי שיבנה זיכרון, יבנה יתרון

ReasoningBank עדיין מגיע מעולם מחקרי, אבל המסר העסקי שלו כבר ברור: סוכן ללא זיכרון נימוקי ימשיך לחזור על טעויות, וסוכן שלומד גם מכישלון יצבור יתרון מצטבר. בחלון הזמן של 12-18 החודשים הקרובים, עסקים ישראלים צריכים לבחון סטאק משולב של AI Agents, WhatsApp Business API, Zoho CRM ו-N8N — לא כטרנד, אלא כתשתית עבודה שנמדדת בשיעור הצלחה, במספר צעדים למשימה ובאיכות קבלת ההחלטות.

שאלות ותשובות

שאלות נפוצות

רוצים ליישם את זה בעסק שלכם?

באוטומציות AI אנחנו בונים סוכני AI ואוטומציות לעסקים בישראל. ראו את השירותים הרלוונטיים:

  • אוטומציה לעסקיםחיבור מערכות, חשבוניות ודשבורדים
  • בוט וואטסאפ לעסקWhatsApp Business API בישראל
  • סוכני AI לעסקיםסוכנים שמטפלים בלידים, שיחות ו-CRM
  • ניהול לידים אוטומטימענה מיידי, ניקוד וסינון אוטומטי

הכתבה הוכנה על-ידי המערכת בליווי בינה מלאכותית: תרגום, סיכום והוספת הקשר עסקי ישראלי מתוך פרסום מקורי של Google Research. קראו על תהליך העריכה שלנו. קישור למקור המקורי.

אהבתם את הכתבה?

הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל

עוד מ־Google Research

כל הכתבות מ־Google Research
גוגל חושפת את טכנולוגיית Agentic RAG לעסקים: דיוק חסר תקדים ל-AI
מחקר
לפני 2 ימים
4 דקות
·מ־Google Research

גוגל חושפת את טכנולוגיית Agentic RAG לעסקים: דיוק חסר תקדים ל-AI

גוגל מציגה את Agentic RAG, ארכיטקטורת רב-סוכנים חדשה המשולבת בפלטפורמת Gemini Enterprise. בניגוד למערכות RAG מסורתיות המחזירות תשובות חלקיות כאשר המידע מבוזר, המנגנון החדש פועל בצורה איטרטיבית. המערכת מחלקת את השאילתה בין סוכנים מומחים (כמו סוכן תכנון וסוכן ניסוח מחדש) ומשתמשת ב'סוכן הקשר מספק' המבצע בקרת איכות קפדנית על תוצאות החיפוש. בבדיקות של גוגל על מאגר המידע FramesQA, המערכת הגיעה ל-90.1% דיוק בחיפושים מורכבים חוצי-מאגרים, תוך שמירה על מהירות מענה כמעט זהה (פגיעה של 3% בלבד בלייטנסי). הטכנולוגיה, הזמינה כעת בגרסת תצוגה מקדימה, פותחת עידן חדש של אמינות ודיוק עבור סוכני AI בארגונים.

Google CloudGemini Enterprise Agent PlatformFramesQA
קרא עוד
מודל בינה מלאכותית לחיזוי שיטפונות: גוגל משחררת את קוד המקור
מחקר
לפני 4 ימים
5 דקות
·מ־Google Research

מודל בינה מלאכותית לחיזוי שיטפונות: גוגל משחררת את קוד המקור

חוקרי Google Research שחררו רשמית את מודל ההידרולוגיה של החברה כקוד פתוח תחת רישיון Apache 2.0. המערכת, המבוססת על ספריית PyTorch ורשתות ME-LSTM, מניעה את חיזויי הזמן האמת של פלטפורמת Flood Hub הגלובלית. המהלך מאפשר לרשויות מטרולוגיות, חברות מים וגופי תשתית להריץ ולעבד נתוני אקלים ומשקעים מקומיים באופן עצמאי ומאובטח על שרתי הארגון. שילוב המודל, שנבחן בשיתוף פעולה עם המכון ההידרומטאורולוגי הצ'כי, מאפשר להאריך את טווח התחזית האמינה בעד שישה ימים באגנים מנוטרים, ומציע לעסקים ולרשויות בישראל כלי רב-עוצמה לניהול סיכוני מזג אוויר ושיפור ההיערכות לאירועי קיצון.

GoogleGitHubPyTorch
קרא עוד
הכרזות גוגל I/O 2026: המעבר לעידן של סוכני בינה מלאכותית אוטונומיים
חדשות
28 במאי 2026
5 דקות
·מ־Google Research

הכרזות גוגל I/O 2026: המעבר לעידן של סוכני בינה מלאכותית אוטונומיים

כנס גוגל I/O 2026 סימן את המעבר הרשמי של התעשייה ל"עידן הסוכנים" (Agentic Era), בו מערכות בינה מלאכותית פועלות באופן אוטונומי לביצוע משימות הנדסה ומחקר מורכבות. לפי דיווח החברה, גוגל השיקה כלים מרובי-סוכנים המסוגלים לבנות מערכות תוכנה שלמות מאפס. בנוסף לפיתוחי התוכנה, גוגל הציגה פריצות דרך במחקר רפואי עם מודל ה-MedGemma הפתוח (שחצה 5 מיליון הורדות), כלים מבוססי AI לחיזוי אקלים, ואת לוח הפיתוח Coralboard לעיבוד נתונים ישירות בציוד קצה. במוקד ההכרזות עמד השבב הקוונטי Willow, שלפי הנתונים מהיר פי 13,000 ממחשבי-על קלאסיים באלגוריתמים ספציפיים. חידושים אלו פותחים דלת לחברות ולסטארט-אפים בישראל לאמץ תהליכי אוטומציה עמוקים יותר.

Google I/O 2026GeminiMedGemma
קרא עוד
אנליטיקה פרטית באפס אמון: מודל האבטחה החדש של גוגל לבינה מלאכותית
מחקר
27 במאי 2026
4 דקות
·מ־Google Research

אנליטיקה פרטית באפס אמון: מודל האבטחה החדש של גוגל לבינה מלאכותית

צוות המחקר של גוגל הציג גישה חדשה לאנליטיקה פרטית באפס אמון (Zero-Trust), המשלבת סביבות ביצוע מהימנות (TEEs) יחד עם קריפטוגרפיה מתקדמת מבוססת סריגים. מטרת הפתרון היא לאפשר למפתחים לאסוף תובנות סטטיסטיות על ביצועי מודלי בינה מלאכותית הרצים על מכשירי קצה, מבלי לקבל גישה למידע הגולמי של המשתמשים בשום שלב. המערכת כבר מיושמת במנגנון Android SafetyCore, ומבטיחה שהמידע יוצפן וישלח בהודעה בודדת (פרוטוקול One-shot), בניגוד לפרוטוקולים ישנים שדרשו חיבור רציף ואינטראקציה מרובת שלבים מצד המכשיר. פריצת דרך זו מאפשרת לחברות לדעת האם מודלי ה-AI שלהן מזהים איומים במדויק, תוך ביטול התלות הבלעדית בבידוד חומרתי המועד למתקפות ערוץ צדדי, ומסמנת את הסטנדרט החדש לאיסוף נתונים מאובטח.

GoogleAndroid SafetyCoreIntel TDX
קרא עוד

עוד כתבות שיעניינו אותך

לכל הכתבות
חישוב עלויות בינה מלאכותית לעסקים: עידן ה-Tokenpocalypse
ניתוח
לפני 7 שעות
4 דקות
·מ־TechCrunch

חישוב עלויות בינה מלאכותית לעסקים: עידן ה-Tokenpocalypse

התקופה שבה כלי בינה מלאכותית (AI) הוצעו במחירים קבועים ונמוכים מגיעה לסיומה. בעקבות שינויי התמחור האחרונים של מיקרוסופט עבור GitHub Copilot ומגבלות התקציב של חברות כמו Uber, התעשייה נכנסת לעידן ה-'טוקנפוקליפסה' (Tokenpocalypse). המשמעות עבור עסקים ברורה: תמחור מבוסס שימוש ריאלי בטוקנים ולא עוד מנויים חודשיים ללא הגבלה. כדי להימנע מחריגות תקציביות חדות, חברות נדרשות לבצע אופטימיזציה של פניות ה-API שלהן, להשתמש במערכות אוטומציה חכמות המנתבות משימות בצורה חסכונית, ולבחון מעבר למודלים ממוקדים וקטנים יותר.

MicrosoftGitHub CopilotAnthropic
קרא עוד
סוכני תוכנה אוטונומיים למפתחים: מיקרוסופט נלחמת על הבכורה מול Anthropic
ניתוח
לפני 2 ימים
4 דקות
·מ־Wired

סוכני תוכנה אוטונומיים למפתחים: מיקרוסופט נלחמת על הבכורה מול Anthropic

כנס המפתחים Build 2026 של מיקרוסופט הדגיש את המאבק העיקש על ליבם של מפתחי התוכנה ברחבי העולם. בעוד Claude Code של Anthropic כובש את השוק עם גישה סוכנותית פורצת דרך, מיקרוסופט משיבה מלחמה ומשיקה את Scout – סוכן פיתוח עצמאי המבוסס על פרויקט הקוד הפתוח OpenClaw. עם תקלות זמניות ב-GitHub ותחרות עזה מתמיד, ענקית הטכנולוגיה מנסה להוכיח שהיא עדיין המובילה הבלתי מעורערת של מהפכת ה-AI, ומסמנת את עתיד הפיתוח: סוכני תוכנה אוטונומיים למפתחים שמבצעים משימות מורכבות ללא צורך בהתערבות ידנית שוטפת.

MicrosoftGitHubScott Hanselman
קרא עוד
עלויות טוקנים בינה מלאכותית: משבר התקציב של עולם ה-AI יוצא משליטה
ניתוח
לפני 2 ימים
4 דקות
·מ־TechCrunch

עלויות טוקנים בינה מלאכותית: משבר התקציב של עולם ה-AI יוצא משליטה

אימוץ סוכני AI עצמאיים הוביל לזינוק חסר תקדים בהוצאות על טוקנים, כאשר חברות מדווחות על חריגות של מאות אחוזים מתקציבי הפיתוח. בעוד חברות ענק כמו Uber ו-Microsoft נאלצות להגביל את רישיונות הפיתוח של עובדיהן בשל עלויות מאמירות, ה-Linux Foundation מכריזה על הקמת ה-Tokenomics Foundation – גוף תקינה בינלאומי שמטרתו להחיל משמעת פיננסית על צריכת משאבי בינה מלאכותית. עבור עסקים, המפתח להישרדות טמון במעבר ממודל פזרני לניהול אופטימלי וניטור בזמן אמת של צריכת ה-API.

UberMicrosoftPriceline
קרא עוד
פרצת אבטחה בסוכני בינה מלאכותית: הלקח מהפריצה לאינסטגרם
ניתוח
לפני 2 ימים
4 דקות
·מ־MIT Technology Review

פרצת אבטחה בסוכני בינה מלאכותית: הלקח מהפריצה לאינסטגרם

פרצת אבטחה חמורה שהתגלתה לאחרונה בסוכן התמיכה מבוסס הבינה המלאכותית של חברת Meta מדגישה את הסיכונים של מתקפות הנדסה חברתית ישירות על מערכות אוטומטיות. תוקפים הצליחו להשתלט על חשבונות אינסטגרם בולטים, כולל חשבון הבית הלבן של אובמה לשעבר, פשוט על ידי בקשה ישירה מסוכן ה-AI לשנות את כתובת הדואר האלקטרוני המשויכת אליהם. במקום להשתמש בקוד מתוחכם, התוקפים ניצלו את נטייתו של מודל השפה הגדול לרצות את המשתמש ולבצע את המשימה ללא אימות בסיסי. האירוע מדגיש כי פריצה לסוכני AI פועלת לעיתים בשיטות פשוטות להפליא, ומחייבת עסקים המטמיעים פתרונות אוטומציה לבנות חומות הגנה קשיחות ואימותים דו-שלביים.

Meta404 MediaInstagram
קרא עוד