בעידן שבו מודלי שפה גדולים (LLMs) נתקלים בקשיים בתכנון משימות מורכבות הדורשות חקירה ותיקון עצמי, מגיעה SPIRAL – מסגרת חדשהני שמשנה את חוקי המשחק. בעוד תהליך החשיבה הליניארי של LLMs נכשל בהתאוששות מטעויות מוקדמות, SPIRAL משלבת אלגוריתם חיפוש עץ מונטה קרלו (MCTS) עם יכולות סמנטיות עשירות של המודלים. לפי המחקר, SPIRAL הופכת את החיפוש מחיפוש כוחני לחיפוש מודרך ומתקן עצמי, ומשיגה תוצאות מרשימות במשימות תכנון אמיתיות.
SPIRAL מבוססת על ארכיטקטורת קוגניטיבית של שלושה סוכני LLM מיוחדים המוטמעים בלולאת MCTS: מתכנן (Planner) שמציע צעדים יצירתיים הבאים, מדמה (Simulator) שמנבא תוצאות מציאותיות ומקיים את החיפוש, ומבקר (Critic) שמספק אותות תגמול צפופים דרך הרהור. לפי הדיווח, צינור התכנון המשולב הזה מאפשר ל-SPIRAL להתמודד עם אתגרים מורכבים כמו שימוש ב-APIs יומיומיים. המסגרת הופכת את MCTS ליעיל יותר על ידי שילוב סמנטיקה עשירה, במקום להסתמך על תגמולים דלילים.
בבדיקות על קבוצות הנתונים DailyLifeAPIs ו-HuggingFace, SPIRAL עלתה על שיטת שרשרת המחשבות הסטנדרטית ועל סוכני תכנון מתקדמים אחרים. המחקר מדווח על דיוק כולל של 83.6% ב-DailyLifeAPIs – שיפור של יותר מ-16 נקודות אחוז לעומת המסגרת המתחרה הטובה ביותר. בנוסף, SPIRAL מציגה יעילות טוקנים גבוהה יותר, מה שהופך אותה לכלי חסכוני יותר לשימוש במשימות אוטונומיות ארוכות טווח.
החדשנות של SPIRAL טמונה בשילוב בין חיפוש מבוסס מציאות, הרהור עצמי ותכנון סמלי, מה שמאפשר ל- LLMs להתגבר על מגבלות החשיבה הליניארית. בהשוואה לשיטות אחרות, SPIRAL מציעה גישה מאוזנת שמנצלת את הכוחות הטבעיים של מודלי שפה גדולים, ומשפרת את היכולת להתמודד עם חוסר ודאות במשימות תכנון. זה רלוונטי במיוחד לסביבות ישראליות שבהן חברות טק זקוקות לפתרונות AI יעילים ומהירים.
עבור מנהלי עסקים ומפתחי AI בישראל, SPIRAL פותחת אפשרויות חדשות לבניית מתכננים אוטונומיים חזקים יותר. קוד המקור, הנספחים והנתונים זמינים במיחסטור הפרויקט הרשמי. האם SPIRAL תהפוך לסטנדרט חדש בתכנון LLM? כדאי לבדוק ולנסות.