מחקר
2 דקות
מ־arXiv cs.AI
ChromouVQA: בנצ'מרק חדש לבדיקת VLMs בתמונות מחופשות צבעוניות
מודלי ראייה-שפה נכשלים בתמונות מחופשות – ChromouVQA חושף את החולשות ומציע פתרון. בנצ'מרק חדש עם תשע משימות VQA מבוסס לוחות אישihara מורחב. קראו עכשיו על הפערים והשיפורים. (92 מילים)
קרא עוד