בעידן שבו מודלי שפה גדולים נתקלים בקשיים בהיגיון מורכב, חוקרים מציגים מודל שיחה רב-סוכנים ממוקד התדיינות קבוצתית. המודל פותר מגבלות של מודלים בודדים באמצעות חלוקת תפקידים תלת-שכבתית: סוכן יצירת דעות, סוכן אימות ראיות ושופט עקביות. תוצאות ניסויים מראות שיפור של 16.8% ב-HotpotQA, 14.3% ב-2WikiMultihopQA ו-19.2% ב-MeetingBank, לצד שיפור עקביות של 21.5%. זהו פתרון יעיל יותר מגישות רב-סוכנים קיימות.
המודל מבוסס על ארכיטקטורה של שלושה סוכנים מרכזיים. סוכן יצירת הדעות מייצר נקודות מבט מגוונות על בעיות היגיון. סוכן אימות הראיות שולף ידע חיצוני ממקורות כמו מאגרי נתונים ומכמת תמיכה עובדתית. סוכן שיפוט העקביות משלב מסקנות הגיוניות וקוהרנטיות. מנגנון משחק עצמי מרחיב מסלולי היגיון רב-נתיביים, בעוד מודול שיפור חיפוש מוסיף ידע חיצוני באופן דינמי.
האימון מבוצע באמצעות פונקציית תגמול מורכבת המשלבת עקביות עובדתית ועקביות לוגית. האסטרטגיה משתמשת בגרסה משופרת של אופטימיזציית מדיניות קרובה (PPO) לאימון שיתופי. לפי המחקר, המודל משיג דיוק גבוה יותר במשימות היגיון רב-קפיצות בהשוואה למודלים רב-סוכנים מובילים, עם יעילות מחשובית גבוהה יותר.
משמעות המחקר בולטת בתחום הבינה המלאכותית, שכן הוא מציע פתרון יציב למשימות מורכבות כמו ניתוח פגישות או שאילתות רב-מקורות. עבור עסקים ישראלים בתחום ההייטק, זה אומר כלים מתקדמים יותר לפיתוח מערכות AI שמקבלות החלטות מבוססות נתונים. השיפורים בדיוק וביעילות יכולים להפחית עלויות פיתוח ולהאיץ חדשנות.
מודל רב-סוכנים זה מסמן כיוון חדש בפיתוח AI, ומזמין מפתחים ומנהלי טכנולוגיה לבחון יישומים עסקיים. מה תהיה ההשפעה על כלי העבודה שלכם?