בעידן שבו סוכני AI אמורים להחליף עובדים בביצוע משימות מורכבות, מציאות אחת מדאיגה: סוכן עם שיעור שגיאה של 1% בכל צעד ייכשל ב-63% מהמקרים אחרי 100 צעדים. Patronus AI, הסטארט-אפ שגייס 20 מיליון דולר ממשקיעים כמו Lightspeed Venture Partners ו-Datadog, מציגה היום את 'סימולטורים גנרטיביים' – ארכיטקטורה חדשה שמשנה את כללי המשחק באימון סוכני AI.
הטכנולוגיה יוצרת סביבות סימולציה אדפטיביות שמייצרות אתגרים חדשים בזמן אמת, מעדכנות חוקים באופן דינמי ומעריכות את ביצועי הסוכן תוך כדי למידה. זהו שינוי מהותי לעומת בנצ'מרקים סטטיים, שכשלו בחיזוי ביצועים בעולם האמיתי. 'בנצ'מרקים מסורתיים בודקים יכולות מבודדות, אבל מפספסים את ההפרעות, מעברי ההקשר והקבלות ההחלטות המורכבות של עבודה אמיתית', אמר אנד קנאפן, מנכ"ל וממייסד שותף של Patronus AI, בראיון בלעדי ל-VentureBeat.
לפי החברה, סימולטורים גנרטיביים בונים על למידה מחוזקת (RL), שבה סוכנים לומדים מניסוי וטעייה עם תגמולים ועונשים. אך בניגוד לגישות מסורתיות הדורשות שכת נרחבת של קוד, הטכנולוגיה החדשה מציעה 'שיפור עצמי רקורסיבי פתוח' (ORSI) – סביבות שבהן סוכנים משתפרים באופן רציף ללא אימון מחדש מלא. 'ראינו מעבר מבנצ'מרקים סטטיים לסביבות אינטראקטיביות', אמרה רבקה צ'יאן, סמנכ"לית טכנולוגיה וממייסדת שותפה.
במרכז הטכנולוגיה ניצב 'מתקן תוכנית לימודים' שמנתח התנהגות הסוכן ומשנה את רמת הקושי והאופי של התרחישים. זהו השראה ממורים אנושיים שמתאימים חומר לרמת התלמיד. קנאפן תיאר זאת כ'אזור גולדילוקס' – נתונים לא קלים מדי ולא קשים מדי. תוצאות ראשוניות מראות שיפור של 10-20% בשיעורי השלמת משימות במשימות כמו הנדסת תוכנה, שירות לקוחות וניתוח פיננסי.
הסימולטורים גנרטיביים פותרים גם בעיית 'האקינג תגמולים', שבה סוכנים מנצלים חולשות בסביבה במקום לפתור בעיות אמיתיות. על ידי יצירת סביבה 'זזה', החברה מונעת רמאויות כאלה. 'זה כמו תלמידים שמרמים במבחן סטטי, אבל בסביבה מתפתחת אנחנו יכולים לבדוק התאמה אמיתית', אמרה צ'יאן.
Patronus AI מדווחת על צמיחה של פי 15 בהכנסות השנה, הודות לסביבות האיכותיות שלה שמתאימות לדגמי AI מתקדמים. הפלטפורמה משמשת חברות Fortune 500 וחברות AI מובילות. למרות תחרות מ-Microsoft, NVIDIA ו-Meta, החברה טוענת שסביבות מיוחדות לתחומים כמו פיננסים, בריאות ואנרגיה קשות לבנייה פנימית.
השקת 'סביבות RL' מסמנת הרחבה מערכת בדיקה לאימון. 'סביבות הן הנפט החדש', אומר קנאפן. החברה שואפת להפוך נתוני עבודה אנושיים לסביבות למידה. זהו נקודת מפנה: מי ששולט בסביבות יעצב את יכולות סוכני AI.
מה זה אומר למנהלי עסקים ישראלים? כדאי לבחון כלים כאלה לשיפור סוכני AI בארגון, לפני שהמתחרים עושים זאת. האם סימולטורים גנרטיביים הם המפתח להצלחה?