בעולם שבו סוכנים מגולמים מבוססי מודלי שפה פועלים בסביבות משתנות, אתגר ההתאמה לדינמיות נותר קריטי להצלחה. חוקרים מציגים את TMoW – Test-time Mixture of World Models, מסגרת המבוססת על תערובת מומחים (MoE) אך גמישה בהרבה. בניגוד לגישות קונבנציונליות קשיחות, TMoW מעדכנת את פונקציית הניתוב בזמן מבחן, ומאפשרת שילוב מודלים קיימים עם חדשים להתאמה רציפה. השיטה משלבת ניתוב מבוסס אבות-טיפוס רב-רמתי, התאמת תכונות בזמן אמת והעשרה מבוססת תערובת מזוקקת. כך, סוכנים מצליחים להתמודד עם דומיינים לא נראים.
TMoW מרחיבה את פרדיגמת MoE לסוכנים מגולמים, שבה מודלי עולם מדויקים חיוניים לקבלת החלטות. בעוד MoE סטנדרטי משמר ניתוב קבוע לאחר אימון, TMoW מאפשרת עדכון דינמי. היא כוללת שלושה מרכיבים מרכזיים: ניתוב מבוסס אבות-טיפוס רב-גרנולריות, המתאים תערובות מדרגת אובייקט לסצנה; התאמה בזמן מבחן, המכוונת תכונות דומיין חדש לאבות הקיימים; והעשרה מבוססת תערובת מזוקקת, המבנות מודלים חדשים מנתונים מועטים. לפי החוקרים, השיטה משפרת משמעותית את ההתאמה.
במבחנים על VirtualHome, ALFWorld ו-RLBench, TMoW הציגה ביצועים חזקים בהתאמה אפס-דוגמאות ובתרחישי הרחבה מועטות-דוגמאות. בסביבות וירטואליות מורכבות, היא אפשרה לסוכנים לפעול ביעילות גם בתנאים דינמיים. השיפורים נובעים מהיכולת לשלב ידע קיים עם למידה מהירה, מה שהופך אותה לרלוונטית ליישומים אמיתיים כמו רובוטיקה ביתית או תעשייתית. החוקרים מדווחים על יתרונות בהשוואה לגישות קודמות.
המשמעות העסקית של TMoW בולטת עבור חברות ישראליות בתחום הרובוטיקה וה-AI, כמו Mobileye או חברות סטארט-אפ בתל אביב. בסביבות דינמיות כמו מפעלים או בתים חכמים, סוכנים גמישים יכולים להפחית זמן פיתוח ולהגביר אמינות. השיטה מציעה דרך להתגבר על מגבלות מודלים קשיחים, ומאפשרת פריסה מהירה יותר בשווקים משתנים. בהקשר ישראלי, היא תומכת בפיתוח סוכנים אוטונומיים בתחבורה ומערכות ביטחוניות.
TMoW מסמנת קפיצה קדימה בהתאמת סוכנים מגולמים, ומזמינה מנהלי טכנולוגיה לשקול שילוב דומה בפרויקטים. מה תהיה ההשפעה על עתיד הרובוטיקה? קראו את המאמר המלא ב-arXiv כדי להעמיק.