בעידן שבו סוכני AI הופכים לכלי מרכזי ביישומים כמו עוזרי קוד או מאמני בריאות אישיים, השאלה המרכזית היא: איך בונים אותם ליעילות מיטבית? חוקרים מגוגל בדקו 180 תצורות סוכנים ושברו את המיתוס ש'יותר סוכנים תמיד טוב יותר'. לפי המחקר, תיאום רב-סוכנים משפר ביצועים דרמטית במשימות מקביליות, אך פוגע קשות במשימות רציפות. המודל החדש שלהם צופה את הארכיטקטורה האופטימלית ב-87% מהמקרים.
במחקר חדש בשם 'לקראת מדע הסקיילינג של מערכות סוכנים', יובין קים וג'ין לו מגוגל ביצעו הערכה מבוקרת על חמש ארכיטקטורות קנוניות: סוכן יחיד (SAS), עצמאיים, מרכזי, מבוזר והיברידי. הבדיקה נערכה על ארבעה ביצועי מידה מגוונים: Finance-Agent (היגיון פיננסי), BrowseComp-Plus (ניווט באינטרנט), PlanCraft (תכנון) ו-Workbench (שימוש בכלים). התוצאות חושפות חוקי סקיילינג כמותיים ראשונים למערכות סוכנים.
התוצאות מראות כי במודלים מתקדמים כמו GPT מגוגל ג'מיני וקלוד מאנתרופיק, מערכות רב-סוכנים אינן פתרון אוניברסלי. במשימות מקביליות כמו ניתוח פיננסי, תיאום מרכזי שיפר את הביצועים ב-80.9% לעומת סוכן יחיד. לעומת זאת, במשימות רציפות כמו תכנון ב-PlanCraft, כל וריאנט רב-סוכנים פגע בביצועים ב-39-70%, בשל עומס תקשורת שמפרק את תהליך החשיבה.
המחקר מגדיר משימות 'סוכניות' ככאלו הדורשות אינטראקציות רב-שלביות עם סביבה חיצונית, איסוף מידע איטרטיבי בתנאי ראות חלקית ושיפור אסטרטגיה על בסיס משוב. ארכיטקטורות רב-סוכנים מציעות יתרונות במשימות שניתן לפרק לתת-משימות מקבילות, אך סובלות מעלות תיאום גבוהה במשימות הדורשות כלים רבים, מה שיוצר 'פקק כלים'.
בנוסף, הארכיטקטורה משמשת כמנגנון בטיחות: מערכות עצמאיות מגבירות שגיאות פי 17.2, בעוד מרכזיות מגבילות זאת ל-4.4 בלבד. המתאם המרכזי פועל כ'בקבוק צוואר' שתופס שגיאות לפני התפשטותן. חוקרי גוגל מדגישים כי סקיילינג נכון תלוי במאפייני המשימה, כמו ניתנות לפרוק וצפיפות כלים.
החוקרים פיתחו מודל חיזוי (R²=0.513) שמזהה את ארכיטקטורת הסקיילינג האופטימלית ב-87% ממשימות לא נראויות, בהתבסס על תכונות מדידות. זה מאפשר למפתחים להחליט באופן מושכל אם להשתמש בשבט סוכנים או במודל יחיד חזק, במקום להסתמך על אינטואיציות.
עם התקדמות מודלים כמו ג'מיני, סקיילינג נכון של מערכות סוכנים יהפוך לקריטי לעסקים ישראליים בתחומי פיננסים, תכנון וניהול כלים. מנהלים צריכים לבחון את מאפייני המשימות שלהם: מקביליות גבוהה מצדיקה רב-סוכנים, בעוד רציפות דורשת פשטות.
המחקר הזה מציב את הבסיס למדע סקיילינג של סוכני AI. מה תהיה הארכיטקטורה הבאה שתשנה את היישומים העסקיים שלכם? קראו את המאמר המלא בגוגל ריסרץ'.