בעידן שבו AI הופך לכלי יומיומי, רוב שיטות הלמידה מחקה מסתמכות על מומחים טכניים שמספקים דגימות רבות ומפקחים על התהליך. זה מהווה מחסום גדול למשתמשים רגילים שרוצים להכשיר סוכן AI למיומנויות ספציפיות. חוקרים מציגים את InterPReT – שיטת אימון ומבנה מחדש אינטראקטיבית של מדיניות – שמאפשרת למשתמשים לתת הוראות, דגימות, ולעקוב אחר הביצועים בזמן אמת. השיטה מעדכנת את מבנה המדיניות ואת הפרמטרים בהתאם להנחיות המשתמש, ומבטיחה מדיניות עמידה יותר.
למידה מחקה הצליחה במשימות רבות על ידי למידה מדגימות של מומחים, אך דורשת כמויות גדולות של נתונים ומעקב צמוד. InterPReT פותרת זאת על ידי אינטראקציה רציפה: המשתמש נותן הוראות טקסטואליות ודגימות, בודק את הביצועים, ובוחן את אסטרטגיות קבלת ההחלטות של הסוכן. כך, גם ללא ידע מעמיק בלמידת מכונה, ניתן להכשיר סוכן יעיל. השיטה מותאמת במיוחד למשתמשי קצה ללא רקע טכני.
במחקר משתמשים עם 34 משתתפים, נבדקה השיטה במשחק נהיגה תחרותי. המשתתפים, שהיו אחראים גם על הדגימות וגם על החלטת סיום האימון, השיגו מדיניות עמידה יותר בהשוואה לשיטת למידה מחקה סטנדרטית. InterPReT לא פגעה בשימושיות המערכת, והוכיחה יתרון משמעותי עבור חובבים. לפי הדיווח, השיטה מתאימה יותר להכשרת מדיניות אמינה על ידי משתמשים לא מקצועיים.
השיטה מציעה הקשר חשוב לעולם העסקי: חברות ישראליות שמשלבות AI יכולות לאפשר לעובדים רגילים להכשיר מודלים מותאמים אישית, ללא צורך בצוותי ML יקרים. בהשוואה לשיטות מסורתיות, InterPReT מפחיתה את הזמן והמשאבים הדרושים, ומגבירה את הגמישות. בישראל, שבה AI צומח במהירות, זה יכול לשנות את אופן אימון סוכנים במגזר הפיננסי, הלוגיסטי והייצור.
לסיכום, InterPReT פותחת דלת להכשרת AI דמוקרטית יותר. מנהלי עסקים צריכים לשקול אימוץ כלים כאלה כדי לשפר תהליכי אוטומציה. מה תכנון להכשיר ראשון?