מה זה תכנון היררכי מרובה-סוכנים ולמה הוא חשוב לעסק?

תכנון היררכי מרובה-סוכנים הוא מבנה שבו רכיב אחד מתאם משאבים וכללים, ורכיבים אחרים מבצעים תתי-משימות במקביל. זה חשוב לעסק כי בתהליכים של 10-20 שלבים, כמו ניהול לידים או תיאום פגישות, סוכן יחיד נוטה לפספס מגבלות כמו תקציב, כפילויות או SLA. שילוב עם Zoho CRM, WhatsApp Business API ו-N8N מאפשר שליטה טובה יותר בתהליך.

איך המחקר על HiMAP-Travel קשור ל-WhatsApp ול-CRM?

הקשר ישיר: גם בתכנון טיול וגם בזרימת שירות או מכירה יש מגבלות רוחביות שחייבים לאכוף לאורך כל התהליך. אם WhatsApp שולח הודעה, ה-CRM פותח רשומה ו-N8N מתאם פגישה, חייבת להיות בקרה שמונעת כפילות או חריגה. במחקר, שכבת transactional monitor והמקביליות שיפרו תוצאה ב-8.67 נקודות אחוז והורידו latency פי 2.5 — עיקרון שרלוונטי מאוד לעסקים.

כמה עולה פיילוט לבניית תהליך agentic עם בקרה לעסק בישראל?

ברוב העסקים הקטנים והבינוניים, פיילוט ראשוני של 14 יום לתהליך אחד — למשל ניתוב לידים או תיאום פגישות — ינוע סביב ₪3,500 עד ₪12,000 להקמה. לאחר מכן יש עלויות שוטפות של רישיונות CRM, קריאות API, WhatsApp Business API ותשתית workflow כמו N8N. העלות המדויקת תלויה בנפח הפניות, במספר האינטגרציות ובדרישות הציות.

מחקר

תכנון טיולים מרובי-סוכנים: למה HiMAP-Travel חשוב לעסקים

המחקר מציג שיפור של 8.67 נקודות אחוז ופי 2.5 פחות השהיה — לקח ישיר לאוטומציה עם מגבלות

צוות אוטומציות AI

8 במרץ 2026

6 דקות קריאה

מבוסס על כתבה שלarXiv cs.AI ↗תרגום, סיכום והקשר עסקי על-ידי המערכתאיך אנחנו עובדים

✨תקציר מנהלים

Key Takeaways

HiMAP-Travel השיגה 52.65% Test FPR עם Qwen3-8B ושיפרה ב-8.67 נקודות אחוז מול DeepTravel.
המערכת עקפה את ATLAS ב-17.65 נקודות אחוז ואת MTP ב-10.0 נקודות אחוז באותה משימת תכנון.
ב-FlexTravelBench היא הגיעה ל-44.34% ב-2 turn ול-37.42% ב-3 turn, עם השהיה נמוכה פי 2.5.
הלקח לעסקים בישראל: תהליכים עם WhatsApp, Zoho CRM ו-N8N צריכים שכבת בקרה מרכזית ולא prompt יחיד.
פיילוט מקומי בסיסי לזרימת agentic עם CRM ו-WhatsApp יכול להתחיל בכ-₪3,500-₪12,000 לפי היקף האינטגרציה.

תכנון טיולים מרובי-סוכנים: למה HiMAP-Travel חשוב לעסקים

HiMAP-Travel השיגה 52.65% Test FPR עם Qwen3-8B ושיפרה ב-8.67 נקודות אחוז מול DeepTravel.
המערכת עקפה את ATLAS ב-17.65 נקודות אחוז ואת MTP ב-10.0 נקודות אחוז באותה משימת תכנון.
ב-FlexTravelBench היא הגיעה ל-44.34% ב-2 turn ול-37.42% ב-3 turn, עם השהיה נמוכה פי 2.5.
הלקח לעסקים בישראל: תהליכים עם WhatsApp, Zoho CRM ו-N8N צריכים שכבת בקרה מרכזית ולא prompt...
פיילוט מקומי בסיסי לזרימת agentic עם CRM ו-WhatsApp יכול להתחיל בכ-₪3,500-₪12,000 לפי היקף האינטגרציה.

תכנון מרובה-סוכנים עם מגבלות: מה HiMAP-Travel באמת מוכיח

HiMAP-Travel הוא מסגרת היררכית לתכנון מרובה-סוכנים שמיועדת להתמודד עם משימות ארוכות טווח תחת מגבלות קשיחות כמו תקציב, ייחודיות וגיוון. לפי המאמר, המערכת שיפרה את שיעור ההצלחה הסופי ב-8.67 נקודות אחוז לעומת baseline סדרתי, ובמקביל קיצרה השהיה פי 2.5 באמצעות עבודה מקבילית.

המשמעות של המחקר הזה רחבה הרבה מעבר לתכנון טיולים. עבור עסקים בישראל, הוא מדגים בעיה שמוכרת היטב בכל פרויקט אוטומציה: ככל שתהליך נעשה ארוך יותר וכולל יותר תנאים, סוכן יחיד או זרימה ליניארית נוטים לסטות מהמטרה. זה קורה בניהול לידים, בתיאום פגישות, בשירות לקוחות ובתהליכי מכירה שבהם חייבים לשמור במקביל על תקציב, SLA, חלוקת עומסים ונתוני CRM תקינים. לפי McKinsey, ארגונים שמיישמים בינה מלאכותית מתקדמים יותר כאשר הם מפרקים תהליך מורכב לתת-משימות עם מדדים ברורים, ולא מנסים לפתור הכול במהלך אחד.

מה זה תכנון היררכי מרובה-סוכנים?

תכנון היררכי מרובה-סוכנים הוא גישה שבה סוכן אחד לא מנסה לבצע לבד את כל המשימה מתחילתה ועד סופה, אלא מחלקים את העבודה בין שכבת תיאום אסטרטגית לבין סוכנים מבצעים שמתמקדים בתתי-משימות. בהקשר עסקי, זה דומה למנהל תפעול שמחלק תקציב ויעדים לצוותים שונים, כאשר כל צוות פועל בתחום מוגדר אך עדיין כפוף לכללים מרכזיים. לדוגמה, משרד נדל"ן ישראלי יכול להפעיל תהליך שבו רכיב אחד מקצה תקציב קמפיינים, ורכיבים אחרים מטפלים בנפרד בלידים מ-WhatsApp, באתר ובטלפון. היתרון הוא שליטה טובה יותר במגבלות לאורך תהליך שנמשך ימים או שבועות, ולא רק בתוך תשובה אחת של מודל שפה.

תוצאות המחקר על HiMAP-Travel וההשוואה למודלים אחרים

לפי הדיווח במאמר arXiv:2603.04750v1, החוקרים בחנו את HiMAP-Travel על סביבת TravelPlanner, שמתמקדת בתכנון מסלולים תחת מגבלות קשיחות. עם המודל Qwen3-8B, המערכת השיגה 52.78% Validation Final Pass Rate ו-52.65% Test Final Pass Rate. באותה מסגרת השוואה, כאשר המודל, האימון והכלים נשמרו זהים, היא עקפה את DeepTravel הסדרתי ב-8.67 נקודות אחוז. זו נקודה חשובה: השיפור כאן לא נבע רק ממודל גדול יותר, אלא מארכיטקטורת תיאום טובה יותר בין סוכנים.

המאמר מוסיף השוואה גם מול ATLAS ו-MTP. לפי הנתונים שפורסמו, HiMAP-Travel עקפה את ATLAS ב-17.65 נקודות אחוז ואת MTP ב-10.0 נקודות אחוז. בנוסף, בתרחישי FlexTravelBench מרובי-תורות המערכת השיגה 44.34% ב-2 turn ו-37.42% ב-3 turn. הנתון העסקי המעניין ביותר הוא ההפחתה בהשהיה: פי 2.5 פחות latency בזכות מקביליות. עבור עסק שמנהל מאות בקשות ביום, קיצור כזה יכול להיות ההבדל בין תגובה תוך דקה לבין תור מצטבר של עשרות פניות בשעות עומס. כאן בדיוק נכנסת החשיבה שמחברת בין אוטומציה עסקית לבין תכנון מבוזר.

שלושת המנגנונים שהופכים את המודל לפרקטי

החידוש במחקר נשען על שלושה מנגנונים ברורים. הראשון הוא transactional monitor שמוודא עמידה בתקציב ובמגבלות ייחודיות בין סוכנים שפועלים במקביל. השני הוא bargaining protocol, כלומר פרוטוקול שבו סוכן מבצע יכול לדחות תת-יעד לא ישים ולבקש תכנון מחדש. השלישי הוא policy יחיד שאומן ב-GRPO ומפעיל את כל הסוכנים באמצעות role conditioning. מנקודת מבט של יישום, זו בחירה חכמה: במקום לאמן ארבע מערכות שונות, החוקרים מחזיקים policy אחד, מה שיכול לצמצם עלויות אימון, לפשט תחזוקה ולשמור על התנהגות עקבית יותר לאורך ה-workflow.

הקשר הרחב: למה סוכנים סדרתיים נכשלים במשימות ארוכות

המחקר מתיישב עם מגמה רחבה יותר בתחום סוכני ה-AI. בשנה האחרונה יותר צוותים מגלים שסוכן סדרתי עובד יפה על משימות קצרות, אבל נחלש כשמוסיפים זיכרון ארוך, כלים חיצוניים ותנאים סותרים. על פי דוח של Gartner, עד 2027 יותר מ-40% מפרויקטי agentic AI יידרשו למסגרות בקרה, הרשאות ומדידת אמינות לפני מעבר לייצור. גם Anthropic, OpenAI ו-Google מדגישות יותר ויותר orchestration, tool use ו-evaluation ולא רק איכות מודל. במילים פשוטות: השוק זז מהדגמות מרשימות לארכיטקטורות שמסוגלות לעמוד בכללים עסקיים אמיתיים.

ניתוח מקצועי: מה המשמעות האמיתית לאוטומציה עסקית

מניסיון בהטמעה אצל עסקים ישראלים, המשמעות האמיתית כאן היא לא "עוד מודל שמצליח בטיולים", אלא הוכחה אמפירית לכך שתהליכים עם מגבלות רוחביות צריכים שכבת תיאום נפרדת משכבת הביצוע. זה רלוונטי במיוחד כאשר עסק רוצה להפעיל סוכני AI לעסקים לצד WhatsApp Business API, Zoho CRM ו-N8N. לדוגמה, אם סוכן אחד עונה ללקוח, סוכן שני מזין כרטיס ב-CRM, וסוכן שלישי מתאם פגישה, חייב להיות מנגנון מרכזי שבודק שלא נשלחו 2 הצעות סותרות, שלא נפתחה פגישה כפולה ושלא חרגתם ממדיניות מחיר. הרבה ארגונים מנסים לפתור זאת עם prompt ארוך אחד, אבל ככל שמוסיפים כללים — הנפילה מגיעה מהר.

מנקודת מבט של יישום בשטח, שלושת המנגנונים במחקר מתורגמים כמעט אחד לאחד לעולם העסקי. transactional monitor דומה לשכבת ולידציה ב-N8N או בלוגיקת backend שבודקת תקציב, סטטוס לקוח וייחודיות רשומות לפני commit. bargaining protocol מזכיר flow שבו תת-תהליך מחזיר שגיאה מבוקרת אם משימה אינה ישימה — למשל כאשר יומן הנציג מלא או כאשר חסר consent לפנייה ב-WhatsApp. וה-policy היחיד עם role conditioning מצביע על כיוון מעניין: במקום לנהל 6 prompts מנותקים, אפשר להפעיל מודל אחד עם תפקידים שונים, לשפר governance ולהוזיל תחזוקה חודשית.

ההשלכות לעסקים בישראל

הענפים שצפויים להרוויח ראשונים מהגישה הזו הם משרדי עורכי דין, סוכני ביטוח, מרפאות פרטיות, משרדי תיווך וחנויות אונליין. הסיבה פשוטה: בכולם יש תהליכים מרובי-שלבים עם מגבלות קשיחות. מרפאה פרטית צריכה להקצות תורים בלי כפילויות, להתחשב בסוג טיפול, לאשר זמינות רופא ולשמור תיעוד. משרד נדל"ן צריך לנתב לידים לפי עיר, תקציב, שפה וזמינות סוכן. סוכנות ביטוח צריכה לוודא שכל פנייה מתועדת, שלא נשלחת הצעה לא רלוונטית, ושכל שיחה עומדת בדרישות ציות. בישראל, שבה זמן תגובה של 5-15 דקות כבר נחשב קריטי במסחר ובשירות, מקביליות עם בקרת מגבלות היא יתרון תפעולי ולא מותרות.

יש כאן גם שכבה רגולטורית ותרבותית. חוק הגנת הפרטיות בישראל מחייב משמעת בנתוני לקוחות, ובמקרים רבים גם הבחנה בין מידע שיווקי, מידע רפואי או נתונים פיננסיים. בנוסף, עסקים מקומיים חייבים להתמודד עם עברית, אנגלית ולעיתים רוסית או ערבית, מה שמגדיל את הסיכוי לשגיאות אם כל הלוגיקה נשענת על סוכן אחד. תרחיש יישומי סביר לעסק קטן-בינוני בישראל יכלול WhatsApp Business API לקליטת פניות, Zoho CRM לניהול הרשומות, N8N לתזמור בין מערכות, ושכבת סוכן AI שמבצעת סיווג, תעדוף וניסוח תגובות. פרויקט פיילוט כזה יכול להתחיל בטווח של ₪3,500-₪12,000 להקמה, ולאחר מכן עלות חודשית של כמה מאות עד אלפי שקלים לפי נפח שיחות, רישיונות CRM וקריאות API. לכן, מי שמתכנן מערכת agentic צריך למדוד לא רק דיוק תשובה, אלא גם שיעור כפילויות, עמידה ב-SLA ועלות לטיפול בפנייה.

מה לעשות עכשיו: צעדים מעשיים לבניית זרימות עם מגבלות

בדקו אם ה-CRM הקיים שלכם — Zoho, HubSpot או Monday — תומך ב-API וב-webhooks שמאפשרים שכבת בקרה חיצונית.
הפעילו פיילוט של 14 יום על תהליך אחד בלבד, למשל תיאום פגישות או ניתוב לידים, ומדדו 3 מדדים: זמן תגובה, שיעור שגיאות וכפילויות ברשומות.
בנו ב-N8N נקודת ולידציה מרכזית לפני כל פעולה קריטית: פתיחת ליד, שליחת הצעה או קביעת פגישה.
אם אתם עובדים עם WhatsApp, ודאו שיש מדיניות ברורה להרשאות, תבניות הודעה, ותיעוד מלא ב-CRM לפני מעבר לפרודקשן.

מבט קדימה: לאן השוק הולך ב-12–18 החודשים הקרובים

ב-12 עד 18 החודשים הקרובים נראה יותר מערכות שעוברות מסוכן אחד "יודע הכול" לארכיטקטורה היררכית עם בקרה, תפקידים ומדדי הצלחה ברורים. המחקר על HiMAP-Travel לא מוכיח שכל עסק צריך ריבוי סוכנים מחר בבוקר, אבל הוא כן מסמן כיוון ברור: כאשר יש תקציב, מגבלות ותהליכים ארוכים, orchestration חשוב לא פחות מהמודל עצמו. עבור עסקים בישראל, הסטאק שכדאי לבחון הוא AI Agents יחד עם WhatsApp Business API, Zoho CRM ו-N8N — לא כטרנד, אלא כבסיס למערכת שניתן למדוד, לבקר ולהרחיב.

שאלות ותשובות

FAQ

הכתבה הוכנה על-ידי המערכת בליווי בינה מלאכותית: תרגום, סיכום והוספת הקשר עסקי ישראלי מתוך פרסום מקורי של arXiv cs.AI. קראו על תהליך העריכה שלנו. קישור למקור המקורי.

אהבתם את הכתבה?

הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל

עוד מ־arXiv cs.AI

כל הכתבות מ־arXiv cs.AI

ספקולטיב דיקודינג במובייל: למה AHASD משנה את המשחק

מחקר

30 באפריל 2026

6 דקות

מ־arXiv cs.AI

ספקולטיב דיקודינג במובייל: למה AHASD משנה את המשחק

**ספקולטיב דיקודינג במובייל הוא דרך להאיץ הרצת מודלי שפה גדולים על מכשירי קצה באמצעות מודל קטן שמכין טיוטה ומודל גדול שמאמת אותה.** במחקר AHASD שפורסם ב-arXiv החוקרים מדווחים על עד פי 4.2 בתפוקה ופי 5.6 ביעילות אנרגטית לעומת בסיס GPU בלבד, עם תקורת חומרה של פחות מ-3% משטח ה-DRAM. עבור עסקים בישראל, המשמעות היא אפשרות עתידית להעביר חלק ממשימות ה-AI למובייל — למשל סיכום שיחות, סיווג פניות והשלמת טפסים — תוך שילוב עם Zoho CRM, ‏WhatsApp Business API ו-N8N. זה עדיין לא מוצר מדף, אבל הכיוון חשוב מאוד לכל ארגון שבונה תהליכי AI מהירים, חסכוניים ורגישים לפרטיות.

Draft Language Model Target Language Model NPU

קרא עוד

Auto-ARGUE להערכת דוחות RAG: למה זה חשוב לעסקים

מחקר

30 באפריל 2026

5 דקות

מ־arXiv cs.AI

Auto-ARGUE להערכת דוחות RAG: למה זה חשוב לעסקים

**Auto-ARGUE הוא כלי להערכת דוחות RAG עם ציטוטים, שנועד לבדוק אם מסמך שנוצר בידי מודל שפה אכן נשען על מקורות נכונים וניתנים לאימות.** לפי התקציר ב-arXiv, החוקרים בחנו אותו על משימות TREC 2024 ומצאו מתאם טוב ברמת המערכת מול שיפוט אנושי. עבור עסקים בישראל, המשמעות ברורה: אם אתם מייצרים סיכומי לידים, תקצירי תיקים, דוחות שירות או מסמכי הנהלה באמצעות מודלי שפה, אתם צריכים שכבת בקרה ולא רק שכבת יצירה. השילוב בין AI Agents,‏ WhatsApp Business API,‏ Zoho CRM ו-N8N יכול לספק תהליך עבודה חזק, אבל בלי מדידת איכות לדוחות עצמם, הסיכון לטעויות עסקיות נשאר גבוה.

TREC 2024 NeuCLIR RAG

קרא עוד

מחקר

28 באפריל 2026

6 דקות

מ־arXiv cs.AI

אופטימיזציית העדפות ללא Likelihood Displacement: מה המחקר משנה

**Likelihood Displacement הוא מצב שבו אימון מודל שפה להעדפות פוגע גם בתשובה הטובה, לא רק בגרועה.** המחקר החדש ב-arXiv מציע מסגרת בשם disentanglement band ושכבת Reward Calibration שמטרתן לשמור על התשובה המועדפת תוך דיכוי התשובה שנדחתה. עבור עסקים בישראל, המשמעות פרקטית מאוד: אם אתם מפעילים סוכן ב-WhatsApp, מחברים אותו ל-Zoho CRM ומנהלים תהליכים דרך N8N, כוונון שגוי עלול לפגוע בשירות, במכירות ובאיכות מיון הלידים. לכן המדד הנכון אינו רק "האם המודל פחות טועה", אלא גם "האם הוא ממשיך לענות היטב במקרים הטובים".

GitHub Reward Calibration disentanglement band

קרא עוד

גרין פרומפטינג ל-LLM: איך ניסוח השאלה משפיע על עלות

מחקר

28 באפריל 2026

6 דקות

מ־arXiv cs.AI

גרין פרומפטינג ל-LLM: איך ניסוח השאלה משפיע על עלות

**גרין פרומפטינג הוא שיטה לניסוח פרומפטים שמפחיתה עלות הרצה של מודלי שפה דרך שינוי המשמעות של המשימה, לא רק קיצור הטקסט.** לפי מחקר arXiv חדש, אורך הפרומפט פחות משמעותי מהסמנטיקה שלו, ומילים מסוימות עשויות להעלות או להוריד צריכת אנרגיה. עבור עסקים בישראל, המשמעות מעשית: אם אתם מחברים LLM ל-WhatsApp, ל-Zoho CRM או לזרימות N8N, ניסוח מדויק יותר יכול לשפר זמן תגובה ולצמצם עלויות API וחישוב. המסקנה המרכזית היא שלא כל תהליך צריך תשובה פתוחה; לעיתים סיווג קצר ומובנה ייתן תוצאה עסקית טובה יותר במחיר נמוך יותר.

OpenAI Anthropic Google

קרא עוד

עוד כתבות שיעניינו אותך

לכל הכתבות

אלגוריתם הליבה של המוח: המרוץ של ג'ף בזוס וחברת Flourish

מחקר

לפני 7 שעות

5 דקות

מ־Wired

אלגוריתם הליבה של המוח: המרוץ של ג'ף בזוס וחברת Flourish

חברת הסטארט-אפ האמריקאית Flourish, בגיבוי של 500 מיליון דולר ומשקיעים בולטים ובראשם ג'ף בזוס, מנסה לפצח את אלגוריתם הליבה של המוח כדי לפתח מערכת בינה סינתטית חסכונית באנרגיה ולומדת ברציפות. המטרה היא ליצור מודלים שרצים על פחות מ-50 ואט ומסוגלים להתאים את עצמם לסביבה בזמן אמת, בדומה לרשתות העצביות הביולוגיות, ללא צורך באימון מחדש יקר בחוות שרתים ענקיות. פריצת דרך זו עשויה לייתר את חוות השרתים העצומות המשמשות כיום למודלי ה-LLMs הגדולים ולהעביר את כוח העיבוד למכשירי קצה מקומיים ומאובטחים.

Flourish Jeff Bezos Thomas Reardon

קרא עוד

מודל בינה מלאכותית לחיזוי שיטפונות: גוגל משחררת את קוד המקור

מחקר

לפני 23 שעות

5 דקות

מ־Google Research

מודל בינה מלאכותית לחיזוי שיטפונות: גוגל משחררת את קוד המקור

חוקרי Google Research שחררו רשמית את מודל ההידרולוגיה של החברה כקוד פתוח תחת רישיון Apache 2.0. המערכת, המבוססת על ספריית PyTorch ורשתות ME-LSTM, מניעה את חיזויי הזמן האמת של פלטפורמת Flood Hub הגלובלית. המהלך מאפשר לרשויות מטרולוגיות, חברות מים וגופי תשתית להריץ ולעבד נתוני אקלים ומשקעים מקומיים באופן עצמאי ומאובטח על שרתי הארגון. שילוב המודל, שנבחן בשיתוף פעולה עם המכון ההידרומטאורולוגי הצ'כי, מאפשר להאריך את טווח התחזית האמינה בעד שישה ימים באגנים מנוטרים, ומציע לעסקים ולרשויות בישראל כלי רב-עוצמה לניהול סיכוני מזג אוויר ושיפור ההיערכות לאירועי קיצון.

Google GitHub PyTorch

קרא עוד

מפתחים מסרבים לעבוד ללא בינה מלאכותית - והמחיר מגיע לשורת הרווח

מחקר

לפני 5 ימים

4 דקות

מ־TechCrunch

מפתחים מסרבים לעבוד ללא בינה מלאכותית - והמחיר מגיע לשורת הרווח

מחקרים ונתונים חדשים מראים כי למרות שמפתחים כיום מסרבים לעבוד ללא סייעני AI ומעידים כי הכלים מכפילים את הפרודוקטיביות שלהם - בפועל, החברות משלמות מחיר יקר. דיווחים מצביעים על כך שחברות ענק כמו אמזון ואובר חוות עלויות ענן חריגות ואי-יציבות במערכות כתוצאה משימוש יתר במודלי שפה לכתיבת קוד. בנוסף, חברות מחקר מעריכות כי קוד המיוצר על ידי בינה מלאכותית מייצר פי 1.7 יותר בעיות פוטנציאליות מקוד אנושי, וגורר השקעת ענק של כ-44% ממשאבי החישוב רק לתיקוני באגים. עבור חברות ישראליות, משמעות הדבר היא שמהירות ההגעה לשוק אינה יכולה לבוא על חשבון תהליכי בקרת איכות קפדניים ומדידת יציבות.

Amazon Uber METR

קרא עוד

אנליטיקה פרטית באפס אמון: מודל האבטחה החדש של גוגל לבינה מלאכותית

מחקר

27 במאי 2026

4 דקות

מ־Google Research

אנליטיקה פרטית באפס אמון: מודל האבטחה החדש של גוגל לבינה מלאכותית

צוות המחקר של גוגל הציג גישה חדשה לאנליטיקה פרטית באפס אמון (Zero-Trust), המשלבת סביבות ביצוע מהימנות (TEEs) יחד עם קריפטוגרפיה מתקדמת מבוססת סריגים. מטרת הפתרון היא לאפשר למפתחים לאסוף תובנות סטטיסטיות על ביצועי מודלי בינה מלאכותית הרצים על מכשירי קצה, מבלי לקבל גישה למידע הגולמי של המשתמשים בשום שלב. המערכת כבר מיושמת במנגנון Android SafetyCore, ומבטיחה שהמידע יוצפן וישלח בהודעה בודדת (פרוטוקול One-shot), בניגוד לפרוטוקולים ישנים שדרשו חיבור רציף ואינטראקציה מרובת שלבים מצד המכשיר. פריצת דרך זו מאפשרת לחברות לדעת האם מודלי ה-AI שלהן מזהים איומים במדויק, תוך ביטול התלות הבלעדית בבידוד חומרתי המועד למתקפות ערוץ צדדי, ומסמנת את הסטנדרט החדש לאיסוף נתונים מאובטח.

Google Android SafetyCore Intel TDX

קרא עוד