Skip to main content
Automaziot AI logo
  • Home
  • Blog
  • About
  • Contact
(646) 760-4854Book a Free Consultation
Automaziot AI - AI Automation and Intelligent Agents for Business

AI Automation Experts. We help businesses streamline operations and scale faster with intelligent agents and workflow automation.

USA(646) 760-4854Israel HQ+972-3-7630715info@automaziot.ai
Israel HQ: Ahad Ha'Am 9, Tel Aviv

Quick Links

  • Home
  • About
  • Contact
  • Case Studies
  • Glossary

Our Solutions

  • Lead Management
  • WhatsApp AI Agent
  • Business Automation
  • Smart CRM
  • Automated Scheduling
  • Sales & Support
  • WhatsApp Commerce
  • AI Agents
  • Tech Consulting

Stay Updated

Get the latest insights on AI automation delivered to your inbox.

FacebookInstagramLinkedIn

This site uses Google Analytics and Vercel Analytics to improve your experience. For full details, see our Privacy Policy

© 2026 Automaziot AI. All rights reserved.

Privacy PolicyTerms of ServiceAccessibilityEditorial Policy
ATLAS: חוקי קנה מידה רב-לשוניים
ATLAS: חוקי קנה מידה מעשיים למודלים רב-לשוניים
ביתחדשותATLAS: חוקי קנה מידה מעשיים למודלים רב-לשוניים
מחקר

ATLAS: חוקי קנה מידה מעשיים למודלים רב-לשוניים

חוקרים מגוגל מציגים ATLAS – כלי חדשני לקביעת גודל מודל, נפח נתונים ותערובת שפות אופטימלית למודלים רב-לשוניים

צוות אוטומציות AIצוות אוטומציות AI
27 בינואר 2026
4 דקות קריאה

תגיות

Google DeepMindGoogle CloudATLASMADLAD-400Shayne LongpreSayna EbrahimiICLR 2026

נושאים קשורים

#מודלים רב-לשוניים#חוקי קנה מידה#עיבוד שפה טבעית#למידת מכונה#העברה בין-לשונית#אימון מודלים
מבוסס על כתבה שלGoogle Research ↗·תרגום, סיכום והקשר עסקי על-ידי המערכתאיך אנחנו עובדים

✨תקציר מנהלים

Key Takeaways

  • ATLAS מבוסס על 774 ריצות אימון ב-400+ שפות ומספק חיזויים מדויקים לביצועים.

  • מטריצת העברה חושפת שפות משלימות כמו עברית לערבית או סוודית לנורווגית.

  • להכפלת שפות: הגדילו מודל ב-1.18 ונתונים ב-1.66.

  • כוונון עדין עדיף עד 144B-283B טוקנים; אחר כך אימון מחדש.

  • כלי פרקטי למפתחים לבניית מודלים גלובליים יעילים.

ATLAS: חוקי קנה מידה מעשיים למודלים רב-לשוניים

  • ATLAS מבוסס על 774 ריצות אימון ב-400+ שפות ומספק חיזויים מדויקים לביצועים.
  • מטריצת העברה חושפת שפות משלימות כמו עברית לערבית או סוודית לנורווגית.
  • להכפלת שפות: הגדילו מודל ב-1.18 ונתונים ב-1.66.
  • כוונון עדין עדיף עד 144B-283B טוקנים; אחר כך אימון מחדש.
  • כלי פרקטי למפתחים לבניית מודלים גלובליים יעילים.

בעולם שבו יותר מ-50% ממשתמשי מודלי AI מדברים שפות שאינן אנגלית, חסר כלי מדעי שמנחה בניית מודלים יעילים לשפות אלה. חוקרים מגוגל קלאוד וגוגל דיפמאיינד מציגים את ATLAS: חוקי קנה מידה רב-לשוניים מעשיים שמספקים הדרכה מדויקת להחלטות מפתח על גודל מודל, נפח נתונים ותערובת שפות. המחקר, שיוצג בכנס ICLR 2026, מבוסס על המחקר הציבורי הגדול ביותר עד כה – 774 ריצות אימון על מודלים מ-10 מיליון עד 8 מיליארד פרמטרים, כולל נתונים מ-400+ שפות והערכות ב-48 שפות.

ATLAS בוחן סינרגיות בין 1,400 זוגות שפות ומציע חוקי קנה מידה אדפטיביים להעברה בין-לשונית. בניגוד לחוקי קנה מידה מסורתיים שמתמקדים באנגלית, ATLAS מתאים לסביבות רב-לשוניות מורכבות וממזער את 'קללת הרב-לשוניות' – ירידה בביצועים עם כל שפה נוספת עקב מגבלות קיבולת. החוק כולל שלושה מרכיבים מרכזיים: מטריצת העברה בין-לשונית שמזהה שפות משלימות, חוק קנה מידה להרחבת גודל מודל ונתונים עם מספר שפות גובר, וכללים לבחירה בין אימון מחדש לבין כוונון עדין מנקודת בדיקה רב-לשונית.

המחקר השתמש במאגר MADLAD-400 לאימון מאות ניסויים רב-לשוניים, תוך חלוקת הנתונים לשלושה מקורות: שפת היעד, שפות העברה דומות (כגון ספרדית, פורטוגזית ואיטלקית לקטלאנית) ושאר השפות. ATLAS חוזה ביצועים על גודלי מודלים חדשים, נפחי נתונים משתנים ותערובות שפות חדשות, ומנצח על עבודות קודמות. בשש שפות לדוגמה – אנגלית, צרפתית, רוסית, סינית, הינדית וסווהילי – נצפו מסלולי קנה מידה דומים, אך עם 'מס קיבולת' לאימון רב-לשוני, במיוחד באנגלית.

מטריצת ההעברה מגלה תובנות אינטואיטיביות: נורווגית מועילה מסוודית וגרמנית, מלאית מאינדונזית, ערבית מעברית. אנגלית, צרפתית וספרדית הן השפות המועילות ביותר בשל איכות וריבוי טקסטים באינטרנט. הגורם החזק ביותר להעברה חיובית הוא שיתוף סקריפט ומשפחת שפה (p < 0.001). העברה אינה תמיד סימטרית, והנתונים הופכים השערות להחלטות מבוססות נתונים.

'קללת הרב-לשוניות' מפורמלת בחוק שמתחשב במספר שפות K, לצד גודל מודל N ונפח נתונים D. הוספת שפות גורמת למס קיבולת קל, אך עם העברה חיובית גבוהה. כדי לתמוך בפעמיים מספר שפות (2K), יש להגדיל גודל מודל ב-1.18 ונתונים ב-1.66, עם 83% נתונים בכל שפה. כך, הסינרגיות מפצות על פחות נתונים לכל שפה.

בנוגע לבחירה בין אימון מחדש לכוונון עדין, ATLAS קובע נקודת חיתוך: כוונון עדין מנקודת 'Unimax' רב-לשונית עדיף בתחילה, אך אימון מחדש עולה עליו לאחר 144B-283B טוקנים (תלוי שפה) במודלים של 2B פרמטרים. ככל שגודל המודל גדל, נקודת החיתוך עולה, ומספקת כלל אצבע מבוסס תקציב.

ATLAS מספק מפת דרכים למפתחים גלובליים לבניית מודלים רב-לשוניים יעילים יותר, תוך התאמה לנתונים זמינים ולשפות ספציפיות. זה מאפשר איזון אופטימלי בין יעילות, איכות ועלות, ומקדם מודלים המשרתים מיליארדי דוברי שפות שאינן אנגלית.

כיצד תיישמו זאת בפרויקט הבא שלכם? האם ATLAS ישנה את אסטרטגיית האימון שלכם?

שאלות ותשובות

FAQ

רוצים ליישם את זה בעסק שלכם?

באוטומציות AI אנחנו בונים סוכני AI ואוטומציות לעסקים בישראל. ראו את השירותים הרלוונטיים:

  • אוטומציה לעסקיםחיבור מערכות, חשבוניות ודשבורדים
  • בוט וואטסאפ לעסקWhatsApp Business API בישראל
  • סוכני AI לעסקיםסוכנים שמטפלים בלידים, שיחות ו-CRM
  • ניהול לידים אוטומטימענה מיידי, ניקוד וסינון אוטומטי

הכתבה הוכנה על-ידי המערכת בליווי בינה מלאכותית: תרגום, סיכום והוספת הקשר עסקי ישראלי מתוך פרסום מקורי של Google Research. קראו על תהליך העריכה שלנו. קישור למקור המקורי.

אהבתם את הכתבה?

הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל

עוד מ־Google Research

כל הכתבות מ־Google Research
אימות מחיקת מידע ממודלי בינה מלאכותית: פריצת הדרך של גוגל
מחקר
לפני 5 ימים
5 דקות
·מ־Google Research

אימות מחיקת מידע ממודלי בינה מלאכותית: פריצת הדרך של גוגל

חוקרי Google Research הציגו בוועידת AISTATS 2026 מסגרת עבודה מהפכנית בשם Regularized f-Divergence Kernel Tests, המיועדת לבצע אימות מחיקת מידע ממודלי בינה מלאכותית. השיטה החדשה מתגברת על כשלי הבדיקות הדו-מדגמיות המסורתיות (כמו MMD), ומאפשרת למבקרים חיצוניים לזהות דליפות מידע מקומיות ברמת דיוק חסרת תקדים. באמצעות שימוש במדדי שונות מתקדמים כמו Hockey-stick divergence ורגולריזציה של ליבות, המערכת מזהה הפרות פרטיות תוך שימוש בכמה אלפי דגימות בלבד בהשוואה למיליוני דגימות שנדרשו בעבר בשיטות כמו DP-Auditorium. פיתוח זה מעניק לעסקים הפועלים תחת רגולציות פרטיות מחמירות כלי מתמטי מוכח להבטחת עמידה בדרישות החוק.

AISTATS 2026Mónica RiberoAntonin Schrab
קרא עוד
גוגל חושפת את טכנולוגיית Agentic RAG לעסקים: דיוק חסר תקדים ל-AI
מחקר
5 ביוני 2026
4 דקות
·מ־Google Research

גוגל חושפת את טכנולוגיית Agentic RAG לעסקים: דיוק חסר תקדים ל-AI

גוגל מציגה את Agentic RAG, ארכיטקטורת רב-סוכנים חדשה המשולבת בפלטפורמת Gemini Enterprise. בניגוד למערכות RAG מסורתיות המחזירות תשובות חלקיות כאשר המידע מבוזר, המנגנון החדש פועל בצורה איטרטיבית. המערכת מחלקת את השאילתה בין סוכנים מומחים (כמו סוכן תכנון וסוכן ניסוח מחדש) ומשתמשת ב'סוכן הקשר מספק' המבצע בקרת איכות קפדנית על תוצאות החיפוש. בבדיקות של גוגל על מאגר המידע FramesQA, המערכת הגיעה ל-90.1% דיוק בחיפושים מורכבים חוצי-מאגרים, תוך שמירה על מהירות מענה כמעט זהה (פגיעה של 3% בלבד בלייטנסי). הטכנולוגיה, הזמינה כעת בגרסת תצוגה מקדימה, פותחת עידן חדש של אמינות ודיוק עבור סוכני AI בארגונים.

Google CloudGemini Enterprise Agent PlatformFramesQA
קרא עוד
מודל בינה מלאכותית לחיזוי שיטפונות: גוגל משחררת את קוד המקור
מחקר
3 ביוני 2026
5 דקות
·מ־Google Research

מודל בינה מלאכותית לחיזוי שיטפונות: גוגל משחררת את קוד המקור

חוקרי Google Research שחררו רשמית את מודל ההידרולוגיה של החברה כקוד פתוח תחת רישיון Apache 2.0. המערכת, המבוססת על ספריית PyTorch ורשתות ME-LSTM, מניעה את חיזויי הזמן האמת של פלטפורמת Flood Hub הגלובלית. המהלך מאפשר לרשויות מטרולוגיות, חברות מים וגופי תשתית להריץ ולעבד נתוני אקלים ומשקעים מקומיים באופן עצמאי ומאובטח על שרתי הארגון. שילוב המודל, שנבחן בשיתוף פעולה עם המכון ההידרומטאורולוגי הצ'כי, מאפשר להאריך את טווח התחזית האמינה בעד שישה ימים באגנים מנוטרים, ומציע לעסקים ולרשויות בישראל כלי רב-עוצמה לניהול סיכוני מזג אוויר ושיפור ההיערכות לאירועי קיצון.

GoogleGitHubPyTorch
קרא עוד
הכרזות גוגל I/O 2026: המעבר לעידן של סוכני בינה מלאכותית אוטונומיים
חדשות
28 במאי 2026
5 דקות
·מ־Google Research

הכרזות גוגל I/O 2026: המעבר לעידן של סוכני בינה מלאכותית אוטונומיים

כנס גוגל I/O 2026 סימן את המעבר הרשמי של התעשייה ל"עידן הסוכנים" (Agentic Era), בו מערכות בינה מלאכותית פועלות באופן אוטונומי לביצוע משימות הנדסה ומחקר מורכבות. לפי דיווח החברה, גוגל השיקה כלים מרובי-סוכנים המסוגלים לבנות מערכות תוכנה שלמות מאפס. בנוסף לפיתוחי התוכנה, גוגל הציגה פריצות דרך במחקר רפואי עם מודל ה-MedGemma הפתוח (שחצה 5 מיליון הורדות), כלים מבוססי AI לחיזוי אקלים, ואת לוח הפיתוח Coralboard לעיבוד נתונים ישירות בציוד קצה. במוקד ההכרזות עמד השבב הקוונטי Willow, שלפי הנתונים מהיר פי 13,000 ממחשבי-על קלאסיים באלגוריתמים ספציפיים. חידושים אלו פותחים דלת לחברות ולסטארט-אפים בישראל לאמץ תהליכי אוטומציה עמוקים יותר.

Google I/O 2026GeminiMedGemma
קרא עוד

עוד כתבות שיעניינו אותך

לכל הכתבות
פענוח תצלומי לוויין באמצעות בינה מלאכותית: מהפכת עיבוד הנתונים בחלל
מחקר
אתמול
4 דקות
·מ־TechCrunch

פענוח תצלומי לוויין באמצעות בינה מלאכותית: מהפכת עיבוד הנתונים בחלל

פריצת דרך היסטורית נרשמה באפריל 2026, כאשר לוויין התצפית Yam-9 של חברת Loft Orbital הצליח לזהות ולפענח עצמים על פני כדור הארץ באופן עצמאי לחלוטין. באמצעות שימוש במעגל מחשוב קצה המבוסס על מעבד Nvidia Jetson Orin AGX ומעטפת התוכנה NAVI-Orbital שפותחה על ידי מעבדת JPL של נאס"א, הלוויין הריץ את מודל השפה-חזותי (VLM) מסוג Gemma 3 של Google DeepMind. פיתוח זה מאפשר ניתוח וסינון ראשוני של נתונים חזותיים מורכבים ישירות בחלל, ומקטין דרמטית את הצורך בהורדת נפחי מידע גולמי עצומים לקרקע. עבור עסקים ותעשיות בישראל כגון חקלאות מדויקת וביטחון מולדת, פריצת הדרך מסמנת מעבר לעיבוד נתונים מהיר, חסכוני ומבוזר המבוסס על בינה מלאכותית.

Loft OrbitalNASAJPL
קרא עוד
אימות מחיקת מידע ממודלי בינה מלאכותית: פריצת הדרך של גוגל
מחקר
לפני 5 ימים
5 דקות
·מ־Google Research

אימות מחיקת מידע ממודלי בינה מלאכותית: פריצת הדרך של גוגל

חוקרי Google Research הציגו בוועידת AISTATS 2026 מסגרת עבודה מהפכנית בשם Regularized f-Divergence Kernel Tests, המיועדת לבצע אימות מחיקת מידע ממודלי בינה מלאכותית. השיטה החדשה מתגברת על כשלי הבדיקות הדו-מדגמיות המסורתיות (כמו MMD), ומאפשרת למבקרים חיצוניים לזהות דליפות מידע מקומיות ברמת דיוק חסרת תקדים. באמצעות שימוש במדדי שונות מתקדמים כמו Hockey-stick divergence ורגולריזציה של ליבות, המערכת מזהה הפרות פרטיות תוך שימוש בכמה אלפי דגימות בלבד בהשוואה למיליוני דגימות שנדרשו בעבר בשיטות כמו DP-Auditorium. פיתוח זה מעניק לעסקים הפועלים תחת רגולציות פרטיות מחמירות כלי מתמטי מוכח להבטחת עמידה בדרישות החוק.

AISTATS 2026Mónica RiberoAntonin Schrab
קרא עוד
למידה מונחית בינה מלאכותית: המחקר החדש של Google DeepMind
מחקר
9 ביוני 2026
4 דקות
·מ־DeepMind

למידה מונחית בינה מלאכותית: המחקר החדש של Google DeepMind

מחקר מבוקר רחב-היקף (RCT) שפורסם על ידי Google DeepMind בשיתוף עם משרד החינוך של סיירה לאון וארגון Fab AI מציג תוצאות פורצות דרך בשילוב בינה מלאכותית בלמידה. הניסוי, שנערך בקרב 1,763 תלמידים לאורך שמונה שבועות, בחן את מודל "הלמידה המונחית" (Guided Learning) המבוסס על Gemini. התוצאות הראו שיפור הישגים ממוצע של 0.258 סטיות תקן במתמטיקה – נתון המקביל לעד 2.5 שנות לימוד בכיתות שבהן המורים שילבו את הכלי באופן אינטנסיבי. במקום לשמש כמנוע תשובות פשוט, המודל הונחה לפעול בשיטה סוקרטית, ושלח שאלות מכוונות ב-76% מהאינטראקציות, בעוד שפתרונות ישירים סופקו ב-2% בלבד מהמקרים. המחקר מדגיש את הפוטנציאל העצום של סוכני AI מבוססי פדגוגיה בעיצוב מחדש של הדרכות והכשרות גם במגזר העסקי.

Google DeepMindGeminiFab AI
קרא עוד
פרצות אבטחה במערכות בינה מלאכותית: איומי האוטומציה החדשים
מחקר
6 ביוני 2026
5 דקות
·מ־Wired

פרצות אבטחה במערכות בינה מלאכותית: איומי האוטומציה החדשים

המעבר המהיר לאוטומציה ושילוב בינה מלאכותית חושף עסקים לפרצות אבטחה חסרות תקדים. דוח אבטחה מקיף של מגזין WIRED חושף כיצד האקרים ניצלו את מערכת התמיכה המבוססת AI של Meta להשתלטות על חשבונות ידוענים, וכיצד כלי ה-AI העוצמתי של Anthropic, המכונה Mythos, משמש את ה-NSA למטרות תקיפה. הדו"ח מדגיש את הסיכון שביישומי בינה מלאכותית ומזהיר את המגזר העסקי מפני הסתמכות עיוורת על כלים אוטונומיים ללא מנגנוני אימות קפדניים.

MetaChainalysisAnthropic
קרא עוד