מחקר20 בפברואר 20265 דקות·מ־arXiv cs.AIRFEval: בדיקת נאמנות חשיבה במודלי AI גדולים**RFEval חושף ש-49.7% מפלטי מודלי LRMs אינם נאמנים.** זה קריטי לעסקים ישראלים: סוכני AI לא אמינים פוגעים בניהול לידים ב-Zoho CRM. צעדים: בדקו עם התערבויות N8N, אמצו מודלים מוכחים.RFEvalLRMsaidaslabקרא עוד