האם 2025 הייתה שנת 'סוכני ה-AI'? חברות ענק הבטיחו אוטומציה מלאה, אך נותרנו רק בדיונים. כעת, מאמר מחקרי בשם 'תחנות הלוצינציה' מטיל צל על החזון: מודלי שפה גדולים (LLMs) מבוססי טרנספורמרים אינם מסוגלים לבצע משימות חישוביות ומעשיות מעבר לרמת מורכבות מסוימת, מתוקף מתמטיקה טהורה. המחברים, וישל סיקה לשעבר מנכ"ל SAP ויועץ AI ותיק, ובנו הצעיר, טוענים שאפילו מודלי חשיבה מתקדמים לא יפתרו את הבעיה. "אין דרך להפוך אותם לאמינים", אומר סיקה.
המאמר פורסם בשקט בתווך ההייפ סביב 'AI סוכני'. סיקה, שכיום מוביל את הסטארט-אפ Vianai, למד AI תחת ג'ון מקארתי, אבי התחום. הוא משווה זאת למשימות קריטיות כמו ניהול תחנות כוח גרעיניות – בלתי אפשרי. התעשייה חלוקה: הצלחות בקידוד AI התפוצצו בשנה האחרונה, ודמיס הסביס מגוגל דיווח בפורום דאבוס על פריצות דרך בהפחתת הלוצינציות.
סטארט-אפ חדש בשם Harmonic מציג פתרון מתמטי: Aristotle, כלי קידוד המאמת פלטי LLMs בשפת Lean. מייסדיו, ולד טנב מ-Robinhood וטודור אכים מתמטיקאי סטנפורד, טוענים שזה מבטיח אמינות. "אנחנו לא נידונים לעולם של שטויות AI", אומר אכים. Harmonic מתמקד ב'סופר-אינטליגנציה מתמטית', ומשלב אימות פורמלי. אך זה מוגבל לקידוד כרגע, לא למשימות כמו כתיבת מאמרי היסטוריה.
עם זאת, OpenAI מודה במאמר מספטמבר: הלוצינציות נמשכות גם במודלים החדישים ביותר. שלושה מודלים, כולל ChatGPT, המציאו כותרות דיסרטציה פיקטיביות. "דיוק של 100% לא יושג לעולם", נאמר בבלוג החברה. הימנשו טיאגי מסנטיאנט מציין שהלוצינציות משבשות זרימות עבודה, ומעכבות אימוץ תאגידי. סוכני AI לא סיפקו ערך משמעותי עדיין.
התעשייה מאמינה בגארדראילים: מסננים שמסננים שגיאות. סיקה עצמו מסכים שרכיבים סביב LLMs יכולים להתגבר על מגבלות. אכים רואה בהלוצינציות תכונה חיונית: "הן מאפשרות ללמוד מעבר לאינטליגנציה אנושית". בשורה התחתונה: סוכני AI בלתי אפשריים ואילו בלתי נמנעים. כל שנה תהיה 'שנת סוכנים נוספים', כשהפער בין גארדראילים להלוצינציות מצטמצם.
עבור מנהלי עסקים ישראלים, השאלה היא כיצד לשלב סוכני AI בבטחה. Harmonic ודומיה מציעים אימות לקידוד, אך משימות מורכבות דורשות פיקוח אנושי. השקעה בסטארט-אפים מקומיים כמו Vianai יכולה להיות צעד חכם, במיוחד עם קשרים ל-SAP ו-Infosys. העתיד: אוטומציה מהירה וזולה יותר מבני אדם, אך עם סיכונים.
אלן קיי, חלוץ מחשבים, רואה זאת כשינוי תרבותי: "המדיום הוא המסר". אוטומציה קוגניטיבית המונית על סף – האם תשפר חיים? לא מתמטיקה תקבע, אלא ניסיון. מנהלים: בדקו כלים כמו Aristotle עכשיו, ובנו גארדראילים מותאמים.
האם סוכני AI ישתלטו על העולם, או שיישארו 'תחנות הלוצינציה'? התשובה תתבהר בפעולה, לא במשוואות.