אימות מחיקת מידע ממודלי בינה מלאכותית: הפתרון החדש של גוגל
האם ניתן לוודא שמערכת בינה מלאכותית באמת "שכחה" מידע רגיש שהוזן אליה? מחקר חדש של חוקרי Google Research, שהוצג בוועידת AISTATS 2026, מציג לראשונה מסגרת עבודה מתמטית מתקדמת בשם Regularized f-Divergence Kernel Tests המאפשרת למבקרים חיצוניים לבצע אימות מחיקת מידע ממודלי בינה מלאכותית בדיוק חסר תקדים ובאמצעות מדגמים קטנים משמעותית מבעבר, מבלי להיחשף למבנה הפנימי של המודל.
מה זה מחיקת למידת מכונה (Machine Unlearning)?
מחיקת למידת מכונה (Machine Unlearning) היא תהליך המאפשר למערכות בינה מלאכותית "לשכוח" חלקים ספציפיים מנתוני האימון שלהן, מבלי שהמפתחים ייאלצו לבצע אימון מחדש (Retraining) של המודל כולו מאפס – תהליך יקר ומורכב להפליא הדורש משאבי מחשוב עצומים. בהקשר עסקי, היכולת הזו קריטית לעמידה ברגולציות פרטיות מחמירות המעניקות למשתמשים את "הזכות להישכח". לדוגמה, אם לקוח של חברה דורש למחוק את כל המידע האישי שלו מהמערכות, על החברה להבטיח שהמידע שלו לא נותר צרוף בתוך הפרמטרים של מודל ה-AI המשמש לשירות לקוחות או לניתוח נתונים. לפי דוחות של ארגוני תקינה, כ-80% מהארגונים המטמיעים AI כיום מתמודדים עם אתגרים מורכבים סביב ניהול זכויות המידע ופרטיות המשתמשים.
אימות מחיקת מידע ממודלי בינה מלאכותית באמצעות השיטה החדשה
על פי הנתונים שפורסמו בדיווח הרשמי של ענקית הטכנולוגיה Google, השיטות המסורתיות להערכת מחיקת מידע נתקלות בקשיים מובנים כאשר מדובר במודלי שפה או מודלי תמונות עצומים. עד כה, שיטה נפוצה להערכה הייתה "מבחן דו-מדגמי" (Two-sample testing), המשווה בין פלטי מודל שמעולם לא נחשף לנתון מסוים לבין פלטי מודל שהיה אמור "לשכוח" אותו. אולם, כפי שמסבירים החוקרים, מודלים גדולים מייצרים רעש סטטיסטי רב המקשה על זיהוי דליפות מידע קטנות ומקומיות. הבדיקות הקיימות, כמו Maximum Mean Discrepancy (MMD), מצטיינות בזיהוי שינויים גלובליים ורחבים, אך נכשלות לחלוטין בזיהוי חריגות מקומיות וספציפיות – למשל, כאשר המודל פולט מידע מזהה על אדם ספציפי רק תחת פרומפט מדויק וייחודי.
כדי לפתור כשלים אלו, פיתחו החוקרים את מסגרת הבדיקה המבוססת על Regularized f-Divergence Kernel Tests. השיטה החדשה משתמשת בכלים סטטיסטיים מתקדמים כמו מדדי השונות של Chi-squared ו-Kullback-Leibler (KL) כדי לזהות הבדלים קטנים ומקומיים בהתפלגות הנתונים. השיטה כוללת שימוש ב-"Hockey-stick divergence", מדד המתאים במיוחד להגדרות פרטיות דיפרנציאלית ומאפשר להגדיר תקציב בטיחות מספרי; הבדיקה מתעלמת משינויים סטטיסטיים זניחים שאינם מסכנים את הפרטיות, ומתריעה רק כאשר מתרחשת חריגה משמעותית מתקציב הבטיחות שהוגדר. פתרון זה מאפשר לבצע בדיקות מקיפות בארגונים המטמיעים פתרונות סוכני AI או מערכות עיבוד נתונים מתקדמות.
בניסויים שערכו החוקרים, הם השתמשו בנתונים מתחום הפיזיקה של אנרגיות גבוהות (משימת Expo1D לזיהוי חריגות), מתוך הנחה שאם המערכת מסוגלת לזהות חלקיקים נדירים המפרים את חוקי הפיזיקה, היא תוכל לזהות בקלות גם דליפות מידע זעירות במודלי בינה מלאכותית. בנוסף, הם בדקו אלגוריתמים נפוצים למחיקת מידע (כמו Selective Synaptic Dampening, גיזום מודלים - Pruning, ושימוש בתגיות אקראיות - Random labels). הבדיקה גילתה ממצא מדאיג: אף אחד מאלגוריתמי המחיקה המקורבים שנבדקו לא עמד בהגדרה המחמירה של בדיקת שני המדגמים המסורתית, בעוד שהמבחן התלת-מדגמי החדש הצליח להפריד בהצלחה בין מודלים ששוכתבו בצורה בטוחה לבין מודלים שלא ביצעו את המחיקה כראוי. לדוגמה, במבחן של פרטיות דיפרנציאלית, המדד המבוסס על Hockey-stick divergence זיהה הפרות פרטיות בשיטה המכונה SVT3 באמצעות כמה אלפי דגימות בלבד, בעוד שכלים קודמים כמו DP-Auditorium דרשו מיליוני דגימות כדי להגיע לאותו אחוז זיהוי.
ההקשר הרחב
המרוץ להבטחת פרטיות במערכות בינה מלאכותית הפך לאחד האתגרים הטכנולוגיים המרכזיים של העשור הנוכחי. לפי דוח של חברת המחקר Gartner, עד סוף השנים הקרובות רוב הרגולציות הגלובליות ידרשו חובת הוכחה אקטיבית לכך שמודלים אינם שומרים שאריות של מידע מזוהה (PII). הפיתוח של גוגל מציג פריצת דרך מתודולוגית: במקום לנסות להגיע ל"שוויון מושלם" מול מודל שאומן מאפס – משימה שהוכחה כבלתי אפשרית מתמטית בשיטות מחיקה מקומיות – החוקרים מציעים מבחן תלת-מדגמי יחסי. המבחן בודק באופן השוואתי האם המודל שנבדק קרוב יותר בהתפלגות שלו למודל הבטוח (שאומן מאפס ללא המידע) או למודל המקורי הנגוע, ובכך מונע התראות שווא (False Positives) רבות שאיפיינו את הבדיקות הקודמות.
ההשלכות לעסקים בישראל
עבור חברות וארגונים בישראל, ובייחוד כאלו הפועלים במגזרים עתירי מידע רגיש כמו פינטק, שירותי בריאות, מערכות פיננסיות, משרדי עורכי דין וסוכנויות ביטוח, למחקר זה יש השפעה ישירה על אסטרטגיית ניהול הנתונים. הרשות להגנת הפרטיות בישראל מחילה כללים נוקשים מכוח חוק הגנת הפרטיות, התשמ"א-1981, בכל הנוגע להחזקת מאגרי מידע וזכות הגישה והתיקון של משתמשים.
כאשר עסקים מקומיים מתחילים לשלב מודלים פנימיים המאומנים על נתוני לקוחותיהם, הם חשופים לסיכונים משפטיים וטכנולוגיים עצומים אם לקוח ידרוש את מחיקת המידע שלו והחברה לא תוכל להוכיח שהנתונים הוסרו בפועל מהמודל. בנוסף לחוק הגנת הפרטיות, יש לקחת בחשבון את המגמות הגלובליות המשפיעות ישירות על חברות ישראליות המייצאות לחו"ל. עסקים המשרתים לקוחות באירופה כפופים לתקנות ה-GDPR, שבהן הזכות להישכח מעוגנת בסעיף 17. ללא יכולת מוכחת ומאומתת סטטיסטית של אימות מחיקת מידע ממודלי בינה מלאכותית, חברות אלו עלולות לעמוד בפני חסמי כניסה שיווקיים ומשפטיים משמעותיים מול לקוחות ארגוניים (Enterprise) הדורשים הוכחות חותכות להגנה על הנתונים שלהם.
מה לעשות עכשיו
כדי להיערך לעידן שבו אימות מחיקת מידע ממודלי בינה מלאכותית יהפוך לסטנדרט מחייב, מומלץ לנקוט בצעדים המעשיים הבאים:
- מיפוי מקורות המידע הרגישים: הגדירו באופן ברור אילו נתוני לקוחות משמשים לאימון או לכוונון (Fine-tuning) של מודלי בינה מלאכותית בארגון, והבדילו אותם מנתונים תפעוליים רגילים המנוהלים במערכות כמו Zoho CRM.
- הטמעת ארכיטקטורת נתונים מודולרית: תכננו את תהליכי עיבוד הנתונים והאוטומציה העסקית באמצעות כלים כמו N8N באופן שיאפשר לעקוב אחר מסלול הנתונים (Data Lineage) מנקודת הקצה ועד להזנתם למודל, כדי לאפשר מחיקה ממוקדת בעת הצורך.
- בחינת פרוטוקולי פרטיות דיפרנציאלית (DP): שקלו שילוב מנגנוני רעש מכויל בתוך תהליכי עיבוד המידע הארגוניים כדי להגביל את השפעתם של נתונים בודדים על תוצרי המערכת מלכתחילה.
- מעקב אחר פתרונות קוד פתוח בתחום: עקבו אחר שחרור ספריות הקוד הפתוח של גוגל המבוססות על Regularized f-Divergence Kernel Tests, ושקלו לשלבן כחלק מתהליכי בקרת האיכות וה-CI/CD של צוותי הפיתוח וה-Data Science שלכם.
מבט קדימה
המחקר של גוגל מדגיש כי הכלים של אתמול אינם מספיקים כדי לנהל את אתגרי המחר של ה-AI. ככל שסוכני בינה מלאכותית הופכים לאוטונומיים יותר ומעבדים כמויות עצומות של מידע בזמן אמת, היכולת לבקר את התנהגותם ולאמת את מחיקת המידע תהפוך לעמודי התווך של אמון הלקוחות. באוטומציות AI, אנו ממשיכים לעקוב אחר פיתוחים אלו כדי להבטיח שהלקוחות שלנו נהנים מהטכנולוגיות המתקדמות ביותר תוך שמירה מלאה על כללי אבטחת מידע ופרטיות קפדניים.