TraderBench למסחר קריפטו ואופציות: למה סוכני AI עדיין לא מסתגלים
**TraderBench הוא בנצ'מרק חדש שבודק סוכני AI פיננסיים לפי ביצועים אמיתיים ולא לפי שיפוט של מודלי שפה.** לפי תקציר המחקר, 13 מודלים נבחנו על כ-50 משימות, ו-8 מהם נתקעו סביב ציון 33 גם תחת תנאי שוק עוינים יותר. המשמעות רחבה הרבה מעבר למסחר: גם בעסקים בישראל, סוכן AI שנראה מצוין במבחן סטטי עלול להיכשל כשהנתונים משתנים בזמן אמת. לכן כדאי למדוד מערכות כאלה לפי KPI כמו זמן תגובה, שיעור המרה ותיקונים ידניים, במיוחד כשמחברים WhatsApp Business API, Zoho CRM ו-N8N לתהליך אחד.
קרא עוד