מחקר
2 דקות
מ־arXiv cs.AI
MARO: חשיבה חזקה יותר למודלי AI מאינטראקציה חברתית
בעולם שבו בני אדם נאלצים לקבל החלטות מורכבות מדי יום במצבים חברתיים, מודלי שפה גדולים (LLMs) נשארים מאחור. אימון מסורתי מבוסס על טקסטים קיימים או בעיות מוגדרות מראש, אך חסר חוויה אמיתית באינטראקציה, משא ומתן ותחרות. מאמר חדש מציג את MARO – Multi-Agent Reward Optimization – שיטה שמאפשרת למודלים ללמוד חשיבה חזקה יותר בסביבות חברתיות רב-סוכנים. קראו עכשיו את הפרטים המלאים!
קרא עוד