אזורים פרמטריים לבטיחות ב‑LLM: למה אי אפשר עדיין “לנעול” את המודל

23 בפברואר 2026

6 דקות

מ־arXiv cs.AI

אזורים פרמטריים לבטיחות ב‑LLM: למה אי אפשר עדיין “לנעול” את המודל

**“אזור בטיחות” במודל שפה גדול הוא ניסיון לזהות תת‑קבוצה של פרמטרים שאחראית להתנהגות בטיחותית, כדי להקפיא/להגביל רק אותה. לפי מחקר arXiv:2602.17696v1, ארבע שיטות נפוצות לזיהוי אזורי בטיחות (ממשקלים ועד שכבות Transformer) מייצרות חפיפה נמוכה‑בינונית במדד IoU, והחפיפה יורדת משמעותית כשמחדדים את האזור בעזרת Utility datasets (שאילתות לא מזיקות).** לעסקים בישראל זה אומר שלא כדאי לבנות על “נעילת פרמטרים” כפתרון בטיחות יחיד, במיוחד כשמחברים LLM ל‑WhatsApp Business API או ל‑Zoho CRM. במקום זאת, מומלץ להוסיף שכבת שער ב‑N8N, להגביל שדות שמותר לשלוף מה‑CRM, ולנהל מסלול הסלמה לנציג אנושי עם לוגים ובקרות ציות לחוק הגנת הפרטיות.

Transformer IoU Meta

קרא עוד