מחקר
6 דקות
מ־arXiv cs.AI
ClinDet-Bench חושף חולשה של מודלי שפה בשיפוט חלקי
**ClinDet-Bench הוא בנצ'מרק חדש שבודק אם מודלי שפה יודעים לזהות מתי אין מספיק מידע כדי לקבל החלטה.** לפי תקציר המחקר, גם מודלים חזקים שמבינים ידע קליני ופועלים היטב עם מידע מלא נכשלים תחת מידע חסר: הם או מכריעים מוקדם מדי או נמנעים יותר מדי. עבור עסקים בישראל, זו תובנה חשובה הרבה מעבר לרפואה. כל תהליך שמחובר ל-WhatsApp, CRM או N8N נשען על נתונים שלעתים חסרים. לכן, לפני שמטמיעים סוכן AI בשירות, מכירות או תפעול, צריך להגדיר שדות חובה, כללי עצירה והסלמה לנציג. זו הדרך להפוך אוטומציה מבוססת מודל שפה לבטוחה ושימושית באמת.
קרא עוד