מחקר
6 דקות
מ־arXiv cs.AI
מדיניות דיפוזיה ב-MARL אונליין: OMAD משפרת תיאום וסמפלים
**OMAD היא מסגרת Online off-policy ל-MARL שמיישמת מדיניות דיפוזיה כדי לשפר תיאום וחקר בסביבה דינמית. לפי המאמר (arXiv:2602.18291v1), החידוש הוא מטרה מרוככת שממקסמת אנטרופיה משותפת בסקיילינג בלי להסתמך על לייקלי-הוד טרקטבילי—נקודת תורפה מוכרת בדיפוזיה.** החוקרים מדווחים על תוצאות SOTA ב-MPE וב-MAMuJoCo, עם שיפור יעילות דגימה פי 2.5–5 ב-10 משימות. לעסקים בישראל זו תזכורת: מערכות החלטה “רב-רכיביות” (שירות, מכירות, תיאום פגישות) דורשות תיאום תחת אי-ודאות, במיוחד ב-WhatsApp. לפני RL בפרודקשן, אפשר להתחיל בבניית שכבת אירועים דרך N8N שמחברת WhatsApp Business API ל-Zoho CRM, ולהגדיר 2–3 מסלולי החלטה מדידים בפיילוט של 14 יום.
קרא עוד