מחקר
6 דקות
מ־arXiv cs.AI
WorkflowPerturb להערכת זרימות עבודה של סוכנים: מדדי איכות עם כיול לחומרה
WorkflowPerturb הוא בנצ'מרק מכויל שמטרתו להפוך ציוני איכות של זרימות עבודה רב־שלביות למשהו שאפשר לפרש תפעולית. לפי הפרסום ב-arXiv, הוא כולל 4,973 זרימות “זהב” ו-44,757 גרסאות מופרעות בשלושה סוגי תקלות—Missing Steps, Compressed Steps ו-Description Changes—ברמות חומרה של 10%, 30% ו-50%. המשמעות לעסקים בישראל: ירידה קטנה בציון עלולה לייצג דילוג על שלב קריטי כמו תיעוד הסכמה או פתיחת רשומה ב-Zoho CRM אחרי פנייה ב-WhatsApp. כדי לצמצם סיכון, כדאי להגדיר שלבי חובה, להריץ פיילוט של 14 יום על 50–200 פניות, ולהוסיף בדיקות צמתים ב-N8N לפני פרודקשן.
קרא עוד