מחקר
5 דקות
מ־arXiv cs.AI
NativeEmbodied: למה כישורי יסוד מגבילים סוכנים פיזיים
**NativeEmbodied הוא בנצ'מרק חדש שמודד סוכנים פיזיים מבוססי VLM לפי פעולות טבעיות ולא לפי קיצורי דרך.** לפי המאמר ב-arXiv, הבדיקה החדשה כוללת 3 משימות מורכבות ו-4 סוגי משימות יסוד, ומראה שכשל במיומנויות בסיסיות מגביל ישירות ביצועים ברמה גבוהה. עבור עסקים בישראל, הלקח רחב יותר מרובוטיקה: גם סוכן AI דיגיטלי נמדד ביכולת לבצע כל שלב נכון — מהודעת WhatsApp, דרך N8N, ועד רישום ב-Zoho CRM. לפני שמטמיעים מערכת אוטונומית, צריך למדוד שליטה, חריגים ואמינות, לא רק דמו מוצלח.
קרא עוד