בעידן שבו מודלי שפה גדולים (LLMs) פותרים בעיות מורכבות, מערכות אג'נטיות רבות נותרות כקופסאות שחורות בלתי ניתנות לשליטה. כיצד תוכלו להבין ולשלוט במערכות כאלה ללא גישה לקוד הפנימי? חוקרים מציגים את Agentic Workflow Reconstruction (AWR), משימה חדשה שמטרתה ליצור זרימת עבודה שקופה ומפורשת שמדמה את התנהגות המערכת השחורה באמצעות גישה בלבד לקלט ולפלט. הכלי החדש, AgentXRay, הופך את האתגר הזה למשימת אופטימיזציה שילובית על תפקידי אג'נטים וקריאות כלים בשרשרת זרימה מובנית. בניגוד להזילת מודלים, AgentXRay מייצר זרימות עבודה לבנות שניתן לערוך, התואמות לפלטים של המערכת המקורית לפי מדד proxy מבוסס פלט, ללא צורך בגישה לפרמטרים.
AgentXRay פועל כמסגרת מבוססת חיפוש שמנווטת במרחב חיפוש עצום באמצעות Monte Carlo Tree Search (MCTS) משופר במנגנון גיזום אדום-שחור מבוסס ציון. המנגנון משלב באופן דינמי את איכות ה-proxy עם עומק החיפוש, ומאפשר חקירה מעמיקה יותר תחת תקציב איטרציות קבוע. החוקרים מדגישים כי הגישה הזו מאפשרת יצירת 'דאבל גודל' לבן ושקוף למערכות אג'נטיות מורכבות, תוך התמקדות בארכיטקטורות שיתוף מפורשות במקום קופסאות שחורות.
בניסויים על תחומים מגוונים, AgentXRay השיג דמיון proxy גבוה יותר בהשוואה לחיפוש לא מגוזם, לצד צריכת טוקנים נמוכה יותר. זה מאפשר חקירה מעמיקה יותר של זרימות עבודה, ומשפר את היעילות הכוללת. הגישה מציעה פתרון פרקטי למפתחים ומנהלי עסקים שרוצים לשלוט במערכות AI אג'נטיות מבלי להסתמך על ספקיות חיצוניות.
המשמעות העסקית של AgentXRay גדולה במיוחד בתעשיית ה-AI הישראלית, שבה חברות רבות מפתחות אג'נטים אוטונומיים. הכלי מאפשר בדיקת אמינות, עריכה ושיפור זרימות עבודה, ומפחית סיכונים הקשורים לקופסאות שחורות. בהשוואה לפלטפורמות כמו LangChain, AgentXRay מציע גישה אוטומטית לשחזור ללא צורך בידע מקדים על הארכיטקטורה.
לסיכום, AgentXRay פותח דלת לשליטה טובה יותר במערכות AI מתקדמות. מנהלי עסקים בישראל צריכים לשקול אינטגרציה של כלים כאלה כדי למקסם יעילות ולוודא שקיפות. האם הגיע הזמן לבדוק את האג'נטים שלכם?