מחקר
4 דקות
מ־arXiv cs.AI
GameDevBench: בדיקת סוכני AI בפיתוח משחקים
GameDevBench חושף: סוכני AI מתקשים בפיתוח משחקים מולטימדיאליים, עם הצלחה של 54.5% בלבד. בנצ'מרק חדש עם 132 משימות מורכבות. גלו כיצד לשפר עם משוב ויזואלי.
קרא עודכל החדשות והניתוחים שלנו בנושא GameDevBench — מתורגמים ומסוכמים ממקורות מובילים בעולם, עם הקשר עסקי ישראלי. 1 כתבות.
GameDevBench חושף: סוכני AI מתקשים בפיתוח משחקים מולטימדיאליים, עם הצלחה של 54.5% בלבד. בנצ'מרק חדש עם 132 משימות מורכבות. גלו כיצד לשפר עם משוב ויזואלי.
קרא עוד