מחקר
2 דקות
מ־arXiv cs.AI
MirrorBench: מסגרת לבדיקת דמיון סוכני משתמשים ב-AI לאדם
מודלי שפה גדולים משמשים כסימולטורים אנושיים, אך התבטאויותיהם לא תמיד דומות לאדם. MirrorBench – מסגרת חדשה לבדיקת דמיון להתנהגות משתמשים אמיתיים. קראו עכשיו על הכלי הפתוח!
קרא עוד