מחקר
2 דקות
מ־arXiv cs.AI
MobiBench: בנצ'מרק מודולרי חדשני לסוכני GUI במובייל
סוכני GUI במובייל מבטיחים מהפכה, אך בדיקתם בעייתית. MobiBench פותרת זאת עם בנצ'מרק offline מודולרי שמשיג 94.72% הסכמה אנושית. קראו על התובנות החדשות.
קרא עודכל החדשות והניתוחים שלנו בנושא MobiBench — מתורגמים ומסוכמים ממקורות מובילים בעולם, עם הקשר עסקי ישראלי. 1 כתבות.
סוכני GUI במובייל מבטיחים מהפכה, אך בדיקתם בעייתית. MobiBench פותרת זאת עם בנצ'מרק offline מודולרי שמשיג 94.72% הסכמה אנושית. קראו על התובנות החדשות.
קרא עוד