כיצד הפתרון של גוגל פותר את כשלי מערכות הבדיקה המסורתיות?

השיטה החדשה, Regularized f-Divergence Kernel Tests, משתמשת במבחן תלת-מדגמי יחסי במקום השוואה דו-מדגמית פשוטה. היא בודקת האם המודל שנחקר קרוב יותר בהתפלגותו למודל בטוח לחלוטין או למודל המקורי שהחזיק במידע הרגיש. שילוב מדדים כמו Hockey-stick divergence מאפשר להגדיר תקציב בטיחות מתמטי מדויק ולחסוך בצורך במיליוני דגימות מחשוב.

מחקר

אימות מחיקת מידע ממודלי בינה מלאכותית: פריצת הדרך של גוגל

חוקרי Google Research מציגים מסגרת עבודה מבוססת-אלגוריתם המאפשרת להוכיח כי מידע רגיש נמחק לחלוטין ממודלי AI

צוות אוטומציות AI

10 ביוני 2026

5 דקות קריאה

מבוסס על כתבה שלGoogle Research ↗תרגום, סיכום והקשר עסקי על-ידי המערכתאיך אנחנו עובדים

✨תקציר מנהלים

נקודות עיקריות

חוקרי Google Research הציגו ב-AISTATS 2026 שיטה חדשה בשם Regularized f-Divergence Kernel Tests לאימות מחיקת מידע.
הבדיקה המבוססת על Hockey-stick divergence מאפשרת להגדיר תקציב בטיחות מספרי מדויק כדי למנוע התראות שווא.
הפתרון החדש זיהה הפרות פרטיות במנגנון SVT3 באמצעות אלפי דגימות בלבד, לעומת מיליוני דגימות שנדרשו בשיטת DP-Auditorium.
המבחן היחסי החדש מונע את כשלי הבדיקות הדו-מדגמיות המסורתיות אשר נטו לפסול מודלים בטוחים לחלוטין.

אימות מחיקת מידע ממודלי בינה מלאכותית: פריצת הדרך של גוגל

חוקרי Google Research הציגו ב-AISTATS 2026 שיטה חדשה בשם Regularized f-Divergence Kernel Tests לאימות מחיקת...
הבדיקה המבוססת על Hockey-stick divergence מאפשרת להגדיר תקציב בטיחות מספרי מדויק כדי למנוע התראות שווא.
הפתרון החדש זיהה הפרות פרטיות במנגנון SVT3 באמצעות אלפי דגימות בלבד, לעומת מיליוני דגימות שנדרשו...
המבחן היחסי החדש מונע את כשלי הבדיקות הדו-מדגמיות המסורתיות אשר נטו לפסול מודלים בטוחים לחלוטין.

אימות מחיקת מידע ממודלי בינה מלאכותית: הפתרון החדש של גוגל

האם ניתן לוודא שמערכת בינה מלאכותית באמת "שכחה" מידע רגיש שהוזן אליה? מחקר חדש של חוקרי Google Research, שהוצג בוועידת AISTATS 2026, מציג לראשונה מסגרת עבודה מתמטית מתקדמת בשם Regularized f-Divergence Kernel Tests המאפשרת למבקרים חיצוניים לבצע אימות מחיקת מידע ממודלי בינה מלאכותית בדיוק חסר תקדים ובאמצעות מדגמים קטנים משמעותית מבעבר, מבלי להיחשף למבנה הפנימי של המודל.

מה זה מחיקת למידת מכונה (Machine Unlearning)?

מחיקת למידת מכונה (Machine Unlearning) היא תהליך המאפשר למערכות בינה מלאכותית "לשכוח" חלקים ספציפיים מנתוני האימון שלהן, מבלי שהמפתחים ייאלצו לבצע אימון מחדש (Retraining) של המודל כולו מאפס – תהליך יקר ומורכב להפליא הדורש משאבי מחשוב עצומים. בהקשר עסקי, היכולת הזו קריטית לעמידה ברגולציות פרטיות מחמירות המעניקות למשתמשים את "הזכות להישכח". לדוגמה, אם לקוח של חברה דורש למחוק את כל המידע האישי שלו מהמערכות, על החברה להבטיח שהמידע שלו לא נותר צרוף בתוך הפרמטרים של מודל ה-AI המשמש לשירות לקוחות או לניתוח נתונים. לפי דוחות של ארגוני תקינה, כ-80% מהארגונים המטמיעים AI כיום מתמודדים עם אתגרים מורכבים סביב ניהול זכויות המידע ופרטיות המשתמשים.

אימות מחיקת מידע ממודלי בינה מלאכותית באמצעות השיטה החדשה

על פי הנתונים שפורסמו בדיווח הרשמי של ענקית הטכנולוגיה Google, השיטות המסורתיות להערכת מחיקת מידע נתקלות בקשיים מובנים כאשר מדובר במודלי שפה או מודלי תמונות עצומים. עד כה, שיטה נפוצה להערכה הייתה "מבחן דו-מדגמי" (Two-sample testing), המשווה בין פלטי מודל שמעולם לא נחשף לנתון מסוים לבין פלטי מודל שהיה אמור "לשכוח" אותו. אולם, כפי שמסבירים החוקרים, מודלים גדולים מייצרים רעש סטטיסטי רב המקשה על זיהוי דליפות מידע קטנות ומקומיות. הבדיקות הקיימות, כמו Maximum Mean Discrepancy (MMD), מצטיינות בזיהוי שינויים גלובליים ורחבים, אך נכשלות לחלוטין בזיהוי חריגות מקומיות וספציפיות – למשל, כאשר המודל פולט מידע מזהה על אדם ספציפי רק תחת פרומפט מדויק וייחודי.

כדי לפתור כשלים אלו, פיתחו החוקרים את מסגרת הבדיקה המבוססת על Regularized f-Divergence Kernel Tests. השיטה החדשה משתמשת בכלים סטטיסטיים מתקדמים כמו מדדי השונות של Chi-squared ו-Kullback-Leibler (KL) כדי לזהות הבדלים קטנים ומקומיים בהתפלגות הנתונים. השיטה כוללת שימוש ב-"Hockey-stick divergence", מדד המתאים במיוחד להגדרות פרטיות דיפרנציאלית ומאפשר להגדיר תקציב בטיחות מספרי; הבדיקה מתעלמת משינויים סטטיסטיים זניחים שאינם מסכנים את הפרטיות, ומתריעה רק כאשר מתרחשת חריגה משמעותית מתקציב הבטיחות שהוגדר. פתרון זה מאפשר לבצע בדיקות מקיפות בארגונים המטמיעים פתרונות סוכני AI או מערכות עיבוד נתונים מתקדמות.

בניסויים שערכו החוקרים, הם השתמשו בנתונים מתחום הפיזיקה של אנרגיות גבוהות (משימת Expo1D לזיהוי חריגות), מתוך הנחה שאם המערכת מסוגלת לזהות חלקיקים נדירים המפרים את חוקי הפיזיקה, היא תוכל לזהות בקלות גם דליפות מידע זעירות במודלי בינה מלאכותית. בנוסף, הם בדקו אלגוריתמים נפוצים למחיקת מידע (כמו Selective Synaptic Dampening, גיזום מודלים - Pruning, ושימוש בתגיות אקראיות - Random labels). הבדיקה גילתה ממצא מדאיג: אף אחד מאלגוריתמי המחיקה המקורבים שנבדקו לא עמד בהגדרה המחמירה של בדיקת שני המדגמים המסורתית, בעוד שהמבחן התלת-מדגמי החדש הצליח להפריד בהצלחה בין מודלים ששוכתבו בצורה בטוחה לבין מודלים שלא ביצעו את המחיקה כראוי. לדוגמה, במבחן של פרטיות דיפרנציאלית, המדד המבוסס על Hockey-stick divergence זיהה הפרות פרטיות בשיטה המכונה SVT3 באמצעות כמה אלפי דגימות בלבד, בעוד שכלים קודמים כמו DP-Auditorium דרשו מיליוני דגימות כדי להגיע לאותו אחוז זיהוי.

ההקשר הרחב

המרוץ להבטחת פרטיות במערכות בינה מלאכותית הפך לאחד האתגרים הטכנולוגיים המרכזיים של העשור הנוכחי. לפי דוח של חברת המחקר Gartner, עד סוף השנים הקרובות רוב הרגולציות הגלובליות ידרשו חובת הוכחה אקטיבית לכך שמודלים אינם שומרים שאריות של מידע מזוהה (PII). הפיתוח של גוגל מציג פריצת דרך מתודולוגית: במקום לנסות להגיע ל"שוויון מושלם" מול מודל שאומן מאפס – משימה שהוכחה כבלתי אפשרית מתמטית בשיטות מחיקה מקומיות – החוקרים מציעים מבחן תלת-מדגמי יחסי. המבחן בודק באופן השוואתי האם המודל שנבדק קרוב יותר בהתפלגות שלו למודל הבטוח (שאומן מאפס ללא המידע) או למודל המקורי הנגוע, ובכך מונע התראות שווא (False Positives) רבות שאיפיינו את הבדיקות הקודמות.

ההשלכות לעסקים בישראל

עבור חברות וארגונים בישראל, ובייחוד כאלו הפועלים במגזרים עתירי מידע רגיש כמו פינטק, שירותי בריאות, מערכות פיננסיות, משרדי עורכי דין וסוכנויות ביטוח, למחקר זה יש השפעה ישירה על אסטרטגיית ניהול הנתונים. הרשות להגנת הפרטיות בישראל מחילה כללים נוקשים מכוח חוק הגנת הפרטיות, התשמ"א-1981, בכל הנוגע להחזקת מאגרי מידע וזכות הגישה והתיקון של משתמשים.

כאשר עסקים מקומיים מתחילים לשלב מודלים פנימיים המאומנים על נתוני לקוחותיהם, הם חשופים לסיכונים משפטיים וטכנולוגיים עצומים אם לקוח ידרוש את מחיקת המידע שלו והחברה לא תוכל להוכיח שהנתונים הוסרו בפועל מהמודל. בנוסף לחוק הגנת הפרטיות, יש לקחת בחשבון את המגמות הגלובליות המשפיעות ישירות על חברות ישראליות המייצאות לחו"ל. עסקים המשרתים לקוחות באירופה כפופים לתקנות ה-GDPR, שבהן הזכות להישכח מעוגנת בסעיף 17. ללא יכולת מוכחת ומאומתת סטטיסטית של אימות מחיקת מידע ממודלי בינה מלאכותית, חברות אלו עלולות לעמוד בפני חסמי כניסה שיווקיים ומשפטיים משמעותיים מול לקוחות ארגוניים (Enterprise) הדורשים הוכחות חותכות להגנה על הנתונים שלהם.

מה לעשות עכשיו

כדי להיערך לעידן שבו אימות מחיקת מידע ממודלי בינה מלאכותית יהפוך לסטנדרט מחייב, מומלץ לנקוט בצעדים המעשיים הבאים:

מיפוי מקורות המידע הרגישים: הגדירו באופן ברור אילו נתוני לקוחות משמשים לאימון או לכוונון (Fine-tuning) של מודלי בינה מלאכותית בארגון, והבדילו אותם מנתונים תפעוליים רגילים המנוהלים במערכות כמו Zoho CRM.
הטמעת ארכיטקטורת נתונים מודולרית: תכננו את תהליכי עיבוד הנתונים והאוטומציה העסקית באמצעות כלים כמו N8N באופן שיאפשר לעקוב אחר מסלול הנתונים (Data Lineage) מנקודת הקצה ועד להזנתם למודל, כדי לאפשר מחיקה ממוקדת בעת הצורך.
בחינת פרוטוקולי פרטיות דיפרנציאלית (DP): שקלו שילוב מנגנוני רעש מכויל בתוך תהליכי עיבוד המידע הארגוניים כדי להגביל את השפעתם של נתונים בודדים על תוצרי המערכת מלכתחילה.
מעקב אחר פתרונות קוד פתוח בתחום: עקבו אחר שחרור ספריות הקוד הפתוח של גוגל המבוססות על Regularized f-Divergence Kernel Tests, ושקלו לשלבן כחלק מתהליכי בקרת האיכות וה-CI/CD של צוותי הפיתוח וה-Data Science שלכם.

מבט קדימה

המחקר של גוגל מדגיש כי הכלים של אתמול אינם מספיקים כדי לנהל את אתגרי המחר של ה-AI. ככל שסוכני בינה מלאכותית הופכים לאוטונומיים יותר ומעבדים כמויות עצומות של מידע בזמן אמת, היכולת לבקר את התנהגותם ולאמת את מחיקת המידע תהפוך לעמודי התווך של אמון הלקוחות. באוטומציות AI, אנו ממשיכים לעקוב אחר פיתוחים אלו כדי להבטיח שהלקוחות שלנו נהנים מהטכנולוגיות המתקדמות ביותר תוך שמירה מלאה על כללי אבטחת מידע ופרטיות קפדניים.

שאלות ותשובות

שאלות נפוצות

הכתבה הוכנה על-ידי המערכת בליווי בינה מלאכותית: תרגום, סיכום והוספת הקשר עסקי ישראלי מתוך פרסום מקורי של Google Research. קראו על תהליך העריכה שלנו. קישור למקור המקורי.

אהבתם את הכתבה?

הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל

עוד מ־Google Research

כל הכתבות מ־Google Research

גוגל חושפת את טכנולוגיית Agentic RAG לעסקים: דיוק חסר תקדים ל-AI

מחקר

לפני 5 ימים

4 דקות

מ־Google Research

גוגל חושפת את טכנולוגיית Agentic RAG לעסקים: דיוק חסר תקדים ל-AI

גוגל מציגה את Agentic RAG, ארכיטקטורת רב-סוכנים חדשה המשולבת בפלטפורמת Gemini Enterprise. בניגוד למערכות RAG מסורתיות המחזירות תשובות חלקיות כאשר המידע מבוזר, המנגנון החדש פועל בצורה איטרטיבית. המערכת מחלקת את השאילתה בין סוכנים מומחים (כמו סוכן תכנון וסוכן ניסוח מחדש) ומשתמשת ב'סוכן הקשר מספק' המבצע בקרת איכות קפדנית על תוצאות החיפוש. בבדיקות של גוגל על מאגר המידע FramesQA, המערכת הגיעה ל-90.1% דיוק בחיפושים מורכבים חוצי-מאגרים, תוך שמירה על מהירות מענה כמעט זהה (פגיעה של 3% בלבד בלייטנסי). הטכנולוגיה, הזמינה כעת בגרסת תצוגה מקדימה, פותחת עידן חדש של אמינות ודיוק עבור סוכני AI בארגונים.

Google Cloud Gemini Enterprise Agent Platform FramesQA

קרא עוד

מודל בינה מלאכותית לחיזוי שיטפונות: גוגל משחררת את קוד המקור

מחקר

3 ביוני 2026

5 דקות

מ־Google Research

מודל בינה מלאכותית לחיזוי שיטפונות: גוגל משחררת את קוד המקור

חוקרי Google Research שחררו רשמית את מודל ההידרולוגיה של החברה כקוד פתוח תחת רישיון Apache 2.0. המערכת, המבוססת על ספריית PyTorch ורשתות ME-LSTM, מניעה את חיזויי הזמן האמת של פלטפורמת Flood Hub הגלובלית. המהלך מאפשר לרשויות מטרולוגיות, חברות מים וגופי תשתית להריץ ולעבד נתוני אקלים ומשקעים מקומיים באופן עצמאי ומאובטח על שרתי הארגון. שילוב המודל, שנבחן בשיתוף פעולה עם המכון ההידרומטאורולוגי הצ'כי, מאפשר להאריך את טווח התחזית האמינה בעד שישה ימים באגנים מנוטרים, ומציע לעסקים ולרשויות בישראל כלי רב-עוצמה לניהול סיכוני מזג אוויר ושיפור ההיערכות לאירועי קיצון.

Google GitHub PyTorch

קרא עוד

הכרזות גוגל I/O 2026: המעבר לעידן של סוכני בינה מלאכותית אוטונומיים

חדשות

28 במאי 2026

5 דקות

מ־Google Research

הכרזות גוגל I/O 2026: המעבר לעידן של סוכני בינה מלאכותית אוטונומיים

כנס גוגל I/O 2026 סימן את המעבר הרשמי של התעשייה ל"עידן הסוכנים" (Agentic Era), בו מערכות בינה מלאכותית פועלות באופן אוטונומי לביצוע משימות הנדסה ומחקר מורכבות. לפי דיווח החברה, גוגל השיקה כלים מרובי-סוכנים המסוגלים לבנות מערכות תוכנה שלמות מאפס. בנוסף לפיתוחי התוכנה, גוגל הציגה פריצות דרך במחקר רפואי עם מודל ה-MedGemma הפתוח (שחצה 5 מיליון הורדות), כלים מבוססי AI לחיזוי אקלים, ואת לוח הפיתוח Coralboard לעיבוד נתונים ישירות בציוד קצה. במוקד ההכרזות עמד השבב הקוונטי Willow, שלפי הנתונים מהיר פי 13,000 ממחשבי-על קלאסיים באלגוריתמים ספציפיים. חידושים אלו פותחים דלת לחברות ולסטארט-אפים בישראל לאמץ תהליכי אוטומציה עמוקים יותר.

Google I/O 2026 Gemini MedGemma

קרא עוד

אנליטיקה פרטית באפס אמון: מודל האבטחה החדש של גוגל לבינה מלאכותית

מחקר

27 במאי 2026

4 דקות

מ־Google Research

אנליטיקה פרטית באפס אמון: מודל האבטחה החדש של גוגל לבינה מלאכותית

צוות המחקר של גוגל הציג גישה חדשה לאנליטיקה פרטית באפס אמון (Zero-Trust), המשלבת סביבות ביצוע מהימנות (TEEs) יחד עם קריפטוגרפיה מתקדמת מבוססת סריגים. מטרת הפתרון היא לאפשר למפתחים לאסוף תובנות סטטיסטיות על ביצועי מודלי בינה מלאכותית הרצים על מכשירי קצה, מבלי לקבל גישה למידע הגולמי של המשתמשים בשום שלב. המערכת כבר מיושמת במנגנון Android SafetyCore, ומבטיחה שהמידע יוצפן וישלח בהודעה בודדת (פרוטוקול One-shot), בניגוד לפרוטוקולים ישנים שדרשו חיבור רציף ואינטראקציה מרובת שלבים מצד המכשיר. פריצת דרך זו מאפשרת לחברות לדעת האם מודלי ה-AI שלהן מזהים איומים במדויק, תוך ביטול התלות הבלעדית בבידוד חומרתי המועד למתקפות ערוץ צדדי, ומסמנת את הסטנדרט החדש לאיסוף נתונים מאובטח.

Google Android SafetyCore Intel TDX

קרא עוד

עוד כתבות שיעניינו אותך

לכל הכתבות

מחקר

אתמול

4 דקות

מ־DeepMind

למידה מונחית בינה מלאכותית: המחקר החדש של Google DeepMind

מחקר מבוקר רחב-היקף (RCT) שפורסם על ידי Google DeepMind בשיתוף עם משרד החינוך של סיירה לאון וארגון Fab AI מציג תוצאות פורצות דרך בשילוב בינה מלאכותית בלמידה. הניסוי, שנערך בקרב 1,763 תלמידים לאורך שמונה שבועות, בחן את מודל "הלמידה המונחית" (Guided Learning) המבוסס על Gemini. התוצאות הראו שיפור הישגים ממוצע של 0.258 סטיות תקן במתמטיקה – נתון המקביל לעד 2.5 שנות לימוד בכיתות שבהן המורים שילבו את הכלי באופן אינטנסיבי. במקום לשמש כמנוע תשובות פשוט, המודל הונחה לפעול בשיטה סוקרטית, ושלח שאלות מכוונות ב-76% מהאינטראקציות, בעוד שפתרונות ישירים סופקו ב-2% בלבד מהמקרים. המחקר מדגיש את הפוטנציאל העצום של סוכני AI מבוססי פדגוגיה בעיצוב מחדש של הדרכות והכשרות גם במגזר העסקי.

Google DeepMind Gemini Fab AI

קרא עוד

פרצות אבטחה במערכות בינה מלאכותית: איומי האוטומציה החדשים

מחקר

לפני 4 ימים

5 דקות

מ־Wired

פרצות אבטחה במערכות בינה מלאכותית: איומי האוטומציה החדשים

המעבר המהיר לאוטומציה ושילוב בינה מלאכותית חושף עסקים לפרצות אבטחה חסרות תקדים. דוח אבטחה מקיף של מגזין WIRED חושף כיצד האקרים ניצלו את מערכת התמיכה המבוססת AI של Meta להשתלטות על חשבונות ידוענים, וכיצד כלי ה-AI העוצמתי של Anthropic, המכונה Mythos, משמש את ה-NSA למטרות תקיפה. הדו"ח מדגיש את הסיכון שביישומי בינה מלאכותית ומזהיר את המגזר העסקי מפני הסתמכות עיוורת על כלים אוטונומיים ללא מנגנוני אימות קפדניים.

Meta Chainalysis Anthropic

קרא עוד

מחקר

לפני 5 ימים

4 דקות

מ־Google Research

גוגל חושפת את טכנולוגיית Agentic RAG לעסקים: דיוק חסר תקדים ל-AI

Google Cloud Gemini Enterprise Agent Platform FramesQA

קרא עוד

אלגוריתם הליבה של המוח: המרוץ של ג'ף בזוס וחברת Flourish

מחקר

לפני 6 ימים

5 דקות

מ־Wired

אלגוריתם הליבה של המוח: המרוץ של ג'ף בזוס וחברת Flourish

חברת הסטארט-אפ האמריקאית Flourish, בגיבוי של 500 מיליון דולר ומשקיעים בולטים ובראשם ג'ף בזוס, מנסה לפצח את אלגוריתם הליבה של המוח כדי לפתח מערכת בינה סינתטית חסכונית באנרגיה ולומדת ברציפות. המטרה היא ליצור מודלים שרצים על פחות מ-50 ואט ומסוגלים להתאים את עצמם לסביבה בזמן אמת, בדומה לרשתות העצביות הביולוגיות, ללא צורך באימון מחדש יקר בחוות שרתים ענקיות. פריצת דרך זו עשויה לייתר את חוות השרתים העצומות המשמשות כיום למודלי ה-LLMs הגדולים ולהעביר את כוח העיבוד למכשירי קצה מקומיים ומאובטחים.

Flourish Jeff Bezos Thomas Reardon

קרא עוד

אימות מחיקת מידע ממודלי בינה מלאכותית: פריצת הדרך של גוגל

✨תקציר מנהלים

נקודות עיקריות

אימות מחיקת מידע ממודלי בינה מלאכותית: פריצת הדרך של גוגל

אימות מחיקת מידע ממודלי בינה מלאכותית: הפתרון החדש של גוגל

מה זה מחיקת למידת מכונה (Machine Unlearning)?

אימות מחיקת מידע ממודלי בינה מלאכותית באמצעות השיטה החדשה

ההקשר הרחב

ההשלכות לעסקים בישראל

מה לעשות עכשיו

מבט קדימה

שאלות ותשובות

שאלות נפוצות

מהו האתגר המרכזי באימות מחיקת מידע ממודלי בינה מלאכותית?

כיצד הפתרון של גוגל פותר את כשלי מערכות הבדיקה המסורתיות?

אהבתם את הכתבה?

עוד מ־Google Research

גוגל חושפת את טכנולוגיית Agentic RAG לעסקים: דיוק חסר תקדים ל-AI

מודל בינה מלאכותית לחיזוי שיטפונות: גוגל משחררת את קוד המקור

הכרזות גוגל I/O 2026: המעבר לעידן של סוכני בינה מלאכותית אוטונומיים

אנליטיקה פרטית באפס אמון: מודל האבטחה החדש של גוגל לבינה מלאכותית

עוד כתבות שיעניינו אותך

למידה מונחית בינה מלאכותית: המחקר החדש של Google DeepMind

פרצות אבטחה במערכות בינה מלאכותית: איומי האוטומציה החדשים

גוגל חושפת את טכנולוגיית Agentic RAG לעסקים: דיוק חסר תקדים ל-AI

אלגוריתם הליבה של המוח: המרוץ של ג'ף בזוס וחברת Flourish