מחקר
2 דקות
מ־arXiv cs.AI
Surgery: מניעת כוונון מזיק במודלי שפה גדולים
האם כוונון עדין מזיק עלול לבטל את כל מנגנוני הבטיחות של מודלי שפה גדולים? חוקרים מציגים Surgery – שיטה חדשה המגינה באמצעות שקיעת תשומת לב. קראו עכשיו על השיפורים בבנצ'מרקים.
קרא עוד