מה היתרון של ארכיטקטורה נטולת מקודדים (Encoder-free) ב-Gemma 4 12B?

במודלים מולטי-מודאליים מסורתיים, יש צורך במקודדים נפרדים לעיבוד תמונות וקבצי קול לפני שהם מועברים למודל השפה. תהליך זה מוסיף השהיה רבה וצורך משאבי זיכרון יקרים. ב-Gemma 4 12B גוגל הסירה את המקודדים לחלוטין: קלט הראייה מעובד באמצעות מודול הטמעה קל במיוחד, וקלט השמע מושלך ישירות לתוך מרחב הנתונים של הטקסט, מה שיוצר תגובה מהירה במיוחד וצריכת זיכרון נמוכה להרצה מקומית.

האם עסקים ישראלים יכולים להשתמש במודל Gemma 4 12B בחינם?

כן, בהחלט. גוגל שחררה את Gemma 4 12B תחת רישיון קוד פתוח מתירני מסוג Apache 2.0. פירוש הדבר הוא שכל עסק, מפתח או חברה בישראל יכולים להוריד את המודל, לבצע בו התאמות אישיות (Fine-Tuning) ולהשתמש בו לצרכים מסחריים ללא תשלום תמלוגים או דמי מנוי, תוך שמירה מלאה על פרטיות המידע הרגיש של לקוחותיהם במחשבים המקומיים.

מוצר חדש

מודל Gemma 4 12B: גוגל משיקה בינה מלאכותית מולטי-מודאלית מקומית

גוגל דיפמיינד חושפת מודל בקוד פתוח ללא מקודדים המאפשר הרצת סוכני AI מקומיים על לפטופים עם 16GB זיכרון בלבד

צוות אוטומציות AI

9 ביוני 2026

4 דקות קריאה

מבוסס על כתבה שלDeepMind ↗תרגום, סיכום והקשר עסקי על-ידי המערכתאיך אנחנו עובדים

✨תקציר מנהלים

Key Takeaways

למעלה מ-150 מיליון הורדות נרשמו למשפחת מודלי Gemma של גוגל ברחבי העולם על פי נתוני החברה.
מודל Gemma 4 12B מסוגל לרוץ באופן מקומי לחלוטין על מחשבים ניידים עם 16GB של זיכרון מאוחד בלבד.
ארכיטקטורה חדשה ומהפכנית נטולת מקודדים (Encoder-free) המאפשרת עיבוד ישיר של קול ותמונות בתוך מודל השפה.
ביצועים קרובים למודל ה-26B MoE הגדול והמתקדם של גוגל, אך בפחות מחצי מנפח הזיכרון הנדרש לפעולה.

מודל Gemma 4 12B: גוגל משיקה בינה מלאכותית מולטי-מודאלית מקומית

למעלה מ-150 מיליון הורדות נרשמו למשפחת מודלי Gemma של גוגל ברחבי העולם על פי נתוני...
מודל Gemma 4 12B מסוגל לרוץ באופן מקומי לחלוטין על מחשבים ניידים עם 16GB של...
ארכיטקטורה חדשה ומהפכנית נטולת מקודדים (Encoder-free) המאפשרת עיבוד ישיר של קול ותמונות בתוך מודל השפה.
ביצועים קרובים למודל ה-26B MoE הגדול והמתקדם של גוגל, אך בפחות מחצי מנפח הזיכרון הנדרש...

מודל Gemma 4 12B: גוגל משיקה בינה מלאכותית מולטי-מודאלית מקומית

גוגל דיפמיינד (Google DeepMind) הכריזה על השקת Gemma 4 12B, מודל בינה מלאכותית פתוח ומולטי-מודאלי המיועד להרצה מקומית על מחשבים ניידים עם 16GB זיכרון בלבד. פריצת הדרך המרכזית במודל החדש היא ארכיטקטורה מאוחדת נטולת מקודדים (Encoder-free), המאפשרת עיבוד ישיר של קלט קולי וחזותי בתוך רשת ה-LLM, ללא תוספת השהיה או זיכרון.

מה זה מודל מולטי-מודאלי נטול מקודדים (Encoder-Free)?

מודל מולטי-מודאלי נטול מקודדים הוא ארכיטקטורת בינה מלאכותית המבטלת את הצורך ברשתות עצביות נפרדות (מקודדים) לתרגום תמונות וסאונד לפני הזנתם למודל השפה. בהקשר עסקי, ארכיטקטורה זו מאפשרת הרצת יישומי בינה מלאכותית מורכבים – המשלבים ראייה ממוחשבת ושמע – ישירות על חומרת הקצה של המשתמש ובמהירות גבוהה בהרבה. לדוגמה, סוכן AI מקומי יכול לנתח קובצי שמע של שיחות שירות או צילומי מסך בזמן אמת, ללא צורך לשלוח את המידע לשרתים חיצוניים יקרים. על פי נתוני גוגל, הארכיטקטורה החדשה מסייעת למשפחת מודלי Gemma לחצות את רף 150 מיליון ההורדות ברחבי העולם, הודות ליעילותה יוצאת הדופן.

היכולות המרכזיות של מודל Gemma 4 12B החדש

על פי הדיווח הרשמי של Google DeepMind, דגם Gemma 4 12B מציע ביצועים המגרדים מלמטה את מודל ה-26B Mixture of Experts (MoE) הגדול בהרבה של החברה, אך בחצי מנפח הזיכרון הנדרש. המודל פותח במטרה להנגיש יכולות של סוכני AI לעסקים ישירות למחשבים ניידים סטנדרטיים, ומאפשר הרצת תהליכי עבודה אוטונומיים ורב-שלביים (Agentic Workflows) בצורה חלקה ומקומית לחלוטין. זהו המודל הראשון בגודל בינוני של גוגל המציע תמיכה מובנית (Native) בקלט של קבצי שמע ללא תיווך.

החברה מדווחת כי הארכיטקטורה המהפכנית של המודל מחליפה את מקודד הראייה המסורתי במודול הטמעה (Embedding) קליל המבוסס על כפל מטריצות יחיד, נרמול ומיקום. בגזרת השמע, עיבוד האודיו פושט אף יותר: גוגל הסירה לחלוטין את מקודד האודיו והשליכה את אות השמע הגולמי ישירות לתוך מרחב הממדים של אסימוני הטקסט (Text Tokens). פיתוח זה, לצד שילוב טכנולוגיית Multi-Token Prediction (MTP) לחיזוי מספר אסימונים במקביל, מפחית משמעותית את זמני התגובה (Latency) והופך את השימוש בחוויית המשתמש המקומית למהירה וקולחת במיוחד.

ההקשר הרחב: מגמת המעבר ל-Edge AI

השקת Gemma 4 12B משקפת את המעבר הגלובלי משרותי ענן ריכוזיים ויקרים אל עבר בינה מלאכותית מבוזרת הפועלת על מכשירי הקצה (Edge AI). לפי דוחות אנליסטים מובילים בתעשייה, פיתוח מודלים יעילים וקטנים המורצים מקומית מאפשר לחברות לצמצם את עלויות ה-API השוטפות בעשרות אחוזים, תוך שמירה על ביצועים הדומים למודלי ענק. המעבר לארכיטקטורות מאוחדות ונטולות מקודדים מסמן את השלב הבא באבולוציה הזו, שבו יעילות קוד החומרה חשובה לא פחות מגודל הפרמטרים של המודל עצמו.

ההשלכות לעסקים בישראל וחשיבות השמירה על הפרטיות

עבור חברות הייטק, מפתחים וארגונים בישראל, מודל מקומי מולטי-מודאלי עוצמתי כמו Gemma 4 12B מהווה בשורה של ממש. מגזרים רגישים בישראל, כגון משרדי עורכי דין, מוסדות פיננסיים, קליניקות רפואיות וחברות ביטוח, נדרשים לעמוד ברגולציות מחמירות של הרשות להגנת הפרטיות בהתאם לחוק הגנת הפרטיות, תשמ"א-1981. היכולת להריץ מודל שפה מתקדם שמנתח תמונות, מסמכים והקלטות שמע מקומית על מחשבי המשרד – מבלי שאף פריט מידע רגיש יישלח לשרתי צד-שלישי בחו"ל – מאפשרת להטמיע פתרונות אוטומציה מתקדמים ללא חשש מחשיפת נתוני לקוחות או עבירה על החוק הישראלי.

מה לעשות עכשיו: מדריך פעולה למנהלים ומפתחים

בחנו את תאימות החומרה שלכם: ודאו כי מחשבי המשרד או תחנות הפיתוח שלכם מצוידים ב-16GB זיכרון מאוחד (כמו מחשבי Apple Silicon עם שבבי M2/M3/M4) או כרטיס מסך תואם (VRAM), כדי לאפשר הרצה מקומית חלקה של המודל.
התנסו בכלים ידידותיים למשתמש: הורידו והריצו את המודל דרך פלטפורמות פשוטות לשימוש כמו LM Studio או Ollama. פלטפורמות אלו מאפשרות לטעון את משקלי המודל בלחיצת כפתור אחת ולהתחיל לעבוד איתו בסביבה סגורה ומאובטחת.
הטמיעו את מודל Gemma באפליקציות שלכם: מפתחים יכולים להוריד את המשקלים של Gemma 4 12B ישירות מ-Hugging Face או Kaggle, ולהשתמש בספריית Unsloth כדי לבצע כוונון עדין (Fine-Tuning) מהיר וחסכוני של המודל לצרכים הספציפיים של העסק.
חקרו את מאגר הכישורים של גוגל: השתמשו ב-Gemma Skills Repository החדש שגוגל שחררה. מאגר זה כולל ספריות קוד מוכנות שיסייעו לכם לבנות סוכנים אוטונומיים המסוגלים לבצע פעולות מורכבות, ניתוח נתונים וקבלת החלטות מבוססת מידע מקומי.

מבט קדימה: עתיד ה-AI המקומי לעסקים

שחרורו של Gemma 4 12B ברישיון קוד פתוח (Apache 2.0) מעניק לעסקים קטנים ובינוניים את הכוח להתחרות בארגוני ענק מבלי לשלם הון עתק על שרתי ענן. שילוב בין מודלים מקומיים קלים ומהירים לבין פלטפורמות כמו N8N או מערכות CRM חכמות, סולל את הדרך ליצירת סביבות עבודה עצמאיות לחלוטין המוגנות בפני דליפות מידע. החיסכון הכלכלי והביטחון המידעי הופכים את ה-Edge AI לסטנדרט החדש של עולם האוטומציה העסקית בשנים הקרובות.

שאלות ותשובות

FAQ

הכתבה הוכנה על-ידי המערכת בליווי בינה מלאכותית: תרגום, סיכום והוספת הקשר עסקי ישראלי מתוך פרסום מקורי של DeepMind. קראו על תהליך העריכה שלנו. קישור למקור המקורי.

אהבתם את הכתבה?

הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל

עוד מ־DeepMind

כל הכתבות מ־DeepMind

גוגל מציגה את DiffusionGemma: טכנולוגיית דיפוזיית טקסט מהירה פי 4

מוצר חדש

לפני 14 שעות

4 דקות

מ־DeepMind

גוגל מציגה את DiffusionGemma: טכנולוגיית דיפוזיית טקסט מהירה פי 4

חברת גוגל (Google) השיקה את DiffusionGemma, מודל קוד פתוח ניסיוני מבוסס טכנולוגיית דיפוזיית טקסט המציע מהירות יצירת טקסט הגבוהה פי 4 בהשוואה למודלים אוטו-רגרסיביים מסורתיים. המודל, המבוסס על סדרת Gemma 4, משלב ארכיטקטורת Mixture of Experts (MoE) עם 26 מיליארד פרמטרים (מתוכם 3.8 מיליארד פעילים בהסקה) ומעבד פסקאות שלמות במקביל במקום מילה אחר מילה. תכונה זו פותרת את צווארי הבקבוק של חומרת קצה ומאפשרת ביצועים של מעל 1,000 אסימונים בשנייה על כרטיסי מסך ארגוניים. עבור עסקים בישראל, פריצת דרך זו מאפשרת הרצת יישומי בינה מלאכותית מקומיים ומאובטחים לחלוטין התואמים את חוק הגנת הפרטיות, ללא תלות בענן ציבורי.

Google Google DeepMind DiffusionGemma

קרא עוד

שילוב בינה מלאכותית פיזית ברובוטים: האקסלרטור של DeepMind

חדשות

אתמול

4 דקות

מ־DeepMind

שילוב בינה מלאכותית פיזית ברובוטים: האקסלרטור של DeepMind

חברת Google DeepMind משיקה את ה-Google DeepMind Accelerator: Robotics, תוכנית האצה ייחודית בת שלושה חודשים המיועדת ל-15 סטארטאפים נבחרים באירופה בתחום הרובוטיקה הפיזית. התוכנית תעניק ליזמים מנטורשיפ צמוד וגישה ישירה למודלי ה-Gemini של גוגל ולשכבות הטכנולוגיה המתקדמות שלה. בין החברות שנבחרו ניתן למצוא סטארטאפים המפתחים פתרונות פורצי דרך בתחומי הבנייה, הרפואה, המיחזור וטכנולוגיות המישוש. המהלך מסמן פריצת דרך משמעותית בשילוב בינה מלאכותית פיזית ברובוטים, ומספק השראה רבה גם לתעשיית הראייה הממוחשבת והאוטומציה המקומית בישראל המבקשת ליישם טכנולוגיות דומות תחת רגולציית הפרטיות המקומית.

Google DeepMind Gemini Touchlab

קרא עוד

מחקר

אתמול

4 דקות

מ־DeepMind

למידה מונחית בינה מלאכותית: המחקר החדש של Google DeepMind

מחקר מבוקר רחב-היקף (RCT) שפורסם על ידי Google DeepMind בשיתוף עם משרד החינוך של סיירה לאון וארגון Fab AI מציג תוצאות פורצות דרך בשילוב בינה מלאכותית בלמידה. הניסוי, שנערך בקרב 1,763 תלמידים לאורך שמונה שבועות, בחן את מודל "הלמידה המונחית" (Guided Learning) המבוסס על Gemini. התוצאות הראו שיפור הישגים ממוצע של 0.258 סטיות תקן במתמטיקה – נתון המקביל לעד 2.5 שנות לימוד בכיתות שבהן המורים שילבו את הכלי באופן אינטנסיבי. במקום לשמש כמנוע תשובות פשוט, המודל הונחה לפעול בשיטה סוקרטית, ושלח שאלות מכוונות ב-76% מהאינטראקציות, בעוד שפתרונות ישירים סופקו ב-2% בלבד מהמקרים. המחקר מדגיש את הפוטנציאל העצום של סוכני AI מבוססי פדגוגיה בעיצוב מחדש של הדרכות והכשרות גם במגזר העסקי.

Google DeepMind Gemini Fab AI

קרא עוד

הסייע הרפואי של Google DeepMind: מערכות בינה מלאכותית למרפאות פרטיות בישראל

מחקר

30 באפריל 2026

4 דקות

מ־DeepMind

הסייע הרפואי של Google DeepMind: מערכות בינה מלאכותית למרפאות פרטיות בישראל

Google DeepMind חשפה את פרויקט "AI co-clinician", סוכן בינה מלאכותית מתקדם המיועד לעבוד בשיתוף פעולה לצד רופאים במרפאות ובסביבות טלמדיסין. בניגוד למערכות המבוססות על טקסט בלבד, המערכת החדשה פועלת על גבי מודלים מולטימודאליים המאפשרים לה לראות, לשמוע ולתקשר עם מטופלים בזמן אמת. במחקרי סימולציה מקיפים שכללו בדיקה של 140 מדדים קליניים, המערכת הציגה ביצועים ברמה המקבילה לרופאי משפחה ב-68 מהמדדים, ואף הצליחה להדריך מטופלים מרחוק בבדיקות פיזיות כמו שימוש נכון במשאף ואיתור פגיעות כתף. בעוד שהטכנולוגיה נמצאת עדיין בשלבי מחקר עולמי, היא מסמנת את הכיוון הברור אליו צועד ענף הרפואה: צמצום העומסים הקריטיים על הצוותים והכפלת יכולות הטיפול באמצעות סייעים דיגיטליים אמינים.

Google DeepMind World Health Organization MedPaLM

קרא עוד

עוד כתבות שיעניינו אותך

לכל הכתבות

מוצר חדש

לפני 14 שעות

4 דקות

מ־DeepMind

גוגל מציגה את DiffusionGemma: טכנולוגיית דיפוזיית טקסט מהירה פי 4

Google Google DeepMind DiffusionGemma

קרא עוד

השקת מודל הבינה המלאכותית Claude Fable 5: ביצועים ועקרונות בטיחות

מוצר חדש

אתמול

4 דקות

מ־TechCrunch

השקת מודל הבינה המלאכותית Claude Fable 5: ביצועים ועקרונות בטיחות

חברת Anthropic השיקה רשמית את Claude Fable 5, הגרסה הציבורית הראשונה של מודל העל שלה Mythos. המודל החדש, המצטיין בכתיבת קוד ובמשימות אנליטיות מורכבות, מציע ביצועים חסרי תקדים שהשיגו 90% במבחני הביצועים של חברת Hex. יחד עם זאת, ההשקה מלווה במנגנוני בטיחות הדוקים החוסמים שימוש בתחומי סייבר וביולוגיה רגישים, ומעבירים את הטיפול ל-Opus 4.8. בנוסף, החברה מציגה מדיניות אבטחה חדשה ומחייבת של שמירת נתונים למשך 30 יום לכלל הלקוחות, ותמחור העומד על 10 דולרים למיליון טוקני קלט ו-50 דולרים למיליון טוקני פלט.

Anthropic Claude Claude Fable 5

קרא עוד

מחשבי AI עם מעבדי RTX Spark: אנבידיה משנה את שוק המחשוב המקומי

מוצר חדש

3 ביוני 2026

4 דקות

מ־Wired

מחשבי AI עם מעבדי RTX Spark: אנבידיה משנה את שוק המחשוב המקומי

ענקית השבבים Nvidia הציגה בתערוכת Computex 2026 את פלטפורמת RTX Spark – שבבי "סופר-צ'יפ" המשלבים מעבד מרכזי N1 בארכיטקטורת Arm, כרטיס מסך עוצמתי ממשפחת RTX וזיכרון מאוחד של עד 128 גיגה-בייט. הכרזה זו מסמנת את תחילתו של עידן ה-AI PC האמיתי, ומספקת לראשונה חלופת Windows עוצמתית למחשבי ה-MacBook Pro של אפל עבור מפתחים ועסקים המעוניינים להריץ מודלי שפה גדולים (LLMs) באופן מקומי לחלוטין. עם תמיכה מלאה בתשתית התוכנה CUDA, מחשבים אלו צפויים להציע ביצועי AI יוצאי דופן במחיר של כ-4,000 דולר לקונפיגורציות הקצה, ומביאים איתם בשורה של ממש לעסקים ישראליים הנדרשים לעמוד בחוקי הגנת הפרטיות הנוקשים.

Nvidia Microsoft HP

קרא עוד

מערכת Data Formulator 0.7: מיקרוסופט חושפת AI לניתוח נתונים עסקיים

מוצר חדש

28 במאי 2026

4 דקות

מ־Microsoft Research

מערכת Data Formulator 0.7: מיקרוסופט חושפת AI לניתוח נתונים עסקיים

מיקרוסופט הכריזה על שחרור גרסת 0.7 של פלטפורמת הקוד הפתוח Data Formulator. המערכת החדשה רותמת סוכני בינה מלאכותית מודעי-הקשר (Context-aware AI agents) במטרה לפשט תהליכי ניתוח נתונים מורכבים בארגונים. הפלטפורמה כוללת רכיב מתקדם של מחברי נתונים המאפשר הזרמת מידע באופן רציף ממסדי נתונים, קבצים מקומיים ומערכות בינה עסקית, תוך מניעת הצורך בעבודות אינטגרציה סיזיפיות מצד מחלקות ה-IT. בנוסף, סביבת העבודה הייחודית (Data Thread) מאפשרת למשתמשי הקצה לנהל שיח שוטף בשפה טבעית מול סוכני ה-AI, לתחקר נתונים, ליצור ויזואליזציות מתקדמות ולייעל את הליך קבלת ההחלטות העסקיות מבלי להזדקק לידע מוקדם בכתיבת קוד או שאילתות מורכבות.

Microsoft Data Formulator Gartner

קרא עוד