Skip to main content
Automaziot AI logo
  • Home
  • Blog
  • About
  • Contact
(646) 760-4854Book a Free Consultation
Automaziot AI - AI Automation and Intelligent Agents for Business

AI Automation Experts. We help businesses streamline operations and scale faster with intelligent agents and workflow automation.

USA(646) 760-4854Israel HQ+972-3-7630715info@automaziot.ai
Israel HQ: Ahad Ha'Am 9, Tel Aviv

Quick Links

  • Home
  • About
  • Contact
  • Case Studies
  • Glossary

Our Solutions

  • Lead Management
  • WhatsApp AI Agent
  • Business Automation
  • Smart CRM
  • Automated Scheduling
  • Sales & Support
  • WhatsApp Commerce
  • AI Agents
  • Tech Consulting

Stay Updated

Get the latest insights on AI automation delivered to your inbox.

FacebookInstagramLinkedIn

This site uses Google Analytics and Vercel Analytics to improve your experience. For full details, see our Privacy Policy

© 2026 Automaziot AI. All rights reserved.

Privacy PolicyTerms of ServiceAccessibilityEditorial Policy
מודל Gemma 4 12B: בינה מלאכותית מקומית | Automaziot AI
מודל Gemma 4 12B: גוגל משיקה בינה מלאכותית מולטי-מודאלית מקומית
ביתחדשותמודל Gemma 4 12B: גוגל משיקה בינה מלאכותית מולטי-מודאלית מקומית
מוצר חדש

מודל Gemma 4 12B: גוגל משיקה בינה מלאכותית מולטי-מודאלית מקומית

גוגל דיפמיינד חושפת מודל בקוד פתוח ללא מקודדים המאפשר הרצת סוכני AI מקומיים על לפטופים עם 16GB זיכרון בלבד

צוות אוטומציות AIצוות אוטומציות AI
9 ביוני 2026
4 דקות קריאה

תגיות

Google DeepMindGemma 4 12BApache 2.0Hugging FaceKaggleLM StudioOllamaUnslothllama.cppvLLMMTP

נושאים קשורים

#בינה מלאכותית#גוגל דיפמיינד#סוכני AI#קוד פתוח#אוטומציה מקומית#פרטיות מידע
מבוסס על כתבה שלDeepMind ↗·תרגום, סיכום והקשר עסקי על-ידי המערכתאיך אנחנו עובדים

✨תקציר מנהלים

Key Takeaways

  • למעלה מ-150 מיליון הורדות נרשמו למשפחת מודלי Gemma של גוגל ברחבי העולם על פי נתוני החברה.

  • מודל Gemma 4 12B מסוגל לרוץ באופן מקומי לחלוטין על מחשבים ניידים עם 16GB של זיכרון מאוחד בלבד.

  • ארכיטקטורה חדשה ומהפכנית נטולת מקודדים (Encoder-free) המאפשרת עיבוד ישיר של קול ותמונות בתוך מודל השפה.

  • ביצועים קרובים למודל ה-26B MoE הגדול והמתקדם של גוגל, אך בפחות מחצי מנפח הזיכרון הנדרש לפעולה.

מודל Gemma 4 12B: גוגל משיקה בינה מלאכותית מולטי-מודאלית מקומית

  • למעלה מ-150 מיליון הורדות נרשמו למשפחת מודלי Gemma של גוגל ברחבי העולם על פי נתוני...
  • מודל Gemma 4 12B מסוגל לרוץ באופן מקומי לחלוטין על מחשבים ניידים עם 16GB של...
  • ארכיטקטורה חדשה ומהפכנית נטולת מקודדים (Encoder-free) המאפשרת עיבוד ישיר של קול ותמונות בתוך מודל השפה.
  • ביצועים קרובים למודל ה-26B MoE הגדול והמתקדם של גוגל, אך בפחות מחצי מנפח הזיכרון הנדרש...

מודל Gemma 4 12B: גוגל משיקה בינה מלאכותית מולטי-מודאלית מקומית

גוגל דיפמיינד (Google DeepMind) הכריזה על השקת Gemma 4 12B, מודל בינה מלאכותית פתוח ומולטי-מודאלי המיועד להרצה מקומית על מחשבים ניידים עם 16GB זיכרון בלבד. פריצת הדרך המרכזית במודל החדש היא ארכיטקטורה מאוחדת נטולת מקודדים (Encoder-free), המאפשרת עיבוד ישיר של קלט קולי וחזותי בתוך רשת ה-LLM, ללא תוספת השהיה או זיכרון.

מה זה מודל מולטי-מודאלי נטול מקודדים (Encoder-Free)?

מודל מולטי-מודאלי נטול מקודדים הוא ארכיטקטורת בינה מלאכותית המבטלת את הצורך ברשתות עצביות נפרדות (מקודדים) לתרגום תמונות וסאונד לפני הזנתם למודל השפה. בהקשר עסקי, ארכיטקטורה זו מאפשרת הרצת יישומי בינה מלאכותית מורכבים – המשלבים ראייה ממוחשבת ושמע – ישירות על חומרת הקצה של המשתמש ובמהירות גבוהה בהרבה. לדוגמה, סוכן AI מקומי יכול לנתח קובצי שמע של שיחות שירות או צילומי מסך בזמן אמת, ללא צורך לשלוח את המידע לשרתים חיצוניים יקרים. על פי נתוני גוגל, הארכיטקטורה החדשה מסייעת למשפחת מודלי Gemma לחצות את רף 150 מיליון ההורדות ברחבי העולם, הודות ליעילותה יוצאת הדופן.

היכולות המרכזיות של מודל Gemma 4 12B החדש

על פי הדיווח הרשמי של Google DeepMind, דגם Gemma 4 12B מציע ביצועים המגרדים מלמטה את מודל ה-26B Mixture of Experts (MoE) הגדול בהרבה של החברה, אך בחצי מנפח הזיכרון הנדרש. המודל פותח במטרה להנגיש יכולות של סוכני AI לעסקים ישירות למחשבים ניידים סטנדרטיים, ומאפשר הרצת תהליכי עבודה אוטונומיים ורב-שלביים (Agentic Workflows) בצורה חלקה ומקומית לחלוטין. זהו המודל הראשון בגודל בינוני של גוגל המציע תמיכה מובנית (Native) בקלט של קבצי שמע ללא תיווך.

החברה מדווחת כי הארכיטקטורה המהפכנית של המודל מחליפה את מקודד הראייה המסורתי במודול הטמעה (Embedding) קליל המבוסס על כפל מטריצות יחיד, נרמול ומיקום. בגזרת השמע, עיבוד האודיו פושט אף יותר: גוגל הסירה לחלוטין את מקודד האודיו והשליכה את אות השמע הגולמי ישירות לתוך מרחב הממדים של אסימוני הטקסט (Text Tokens). פיתוח זה, לצד שילוב טכנולוגיית Multi-Token Prediction (MTP) לחיזוי מספר אסימונים במקביל, מפחית משמעותית את זמני התגובה (Latency) והופך את השימוש בחוויית המשתמש המקומית למהירה וקולחת במיוחד.

ההקשר הרחב: מגמת המעבר ל-Edge AI

השקת Gemma 4 12B משקפת את המעבר הגלובלי משרותי ענן ריכוזיים ויקרים אל עבר בינה מלאכותית מבוזרת הפועלת על מכשירי הקצה (Edge AI). לפי דוחות אנליסטים מובילים בתעשייה, פיתוח מודלים יעילים וקטנים המורצים מקומית מאפשר לחברות לצמצם את עלויות ה-API השוטפות בעשרות אחוזים, תוך שמירה על ביצועים הדומים למודלי ענק. המעבר לארכיטקטורות מאוחדות ונטולות מקודדים מסמן את השלב הבא באבולוציה הזו, שבו יעילות קוד החומרה חשובה לא פחות מגודל הפרמטרים של המודל עצמו.

ההשלכות לעסקים בישראל וחשיבות השמירה על הפרטיות

עבור חברות הייטק, מפתחים וארגונים בישראל, מודל מקומי מולטי-מודאלי עוצמתי כמו Gemma 4 12B מהווה בשורה של ממש. מגזרים רגישים בישראל, כגון משרדי עורכי דין, מוסדות פיננסיים, קליניקות רפואיות וחברות ביטוח, נדרשים לעמוד ברגולציות מחמירות של הרשות להגנת הפרטיות בהתאם לחוק הגנת הפרטיות, תשמ"א-1981. היכולת להריץ מודל שפה מתקדם שמנתח תמונות, מסמכים והקלטות שמע מקומית על מחשבי המשרד – מבלי שאף פריט מידע רגיש יישלח לשרתי צד-שלישי בחו"ל – מאפשרת להטמיע פתרונות אוטומציה מתקדמים ללא חשש מחשיפת נתוני לקוחות או עבירה על החוק הישראלי.

מה לעשות עכשיו: מדריך פעולה למנהלים ומפתחים

  1. בחנו את תאימות החומרה שלכם: ודאו כי מחשבי המשרד או תחנות הפיתוח שלכם מצוידים ב-16GB זיכרון מאוחד (כמו מחשבי Apple Silicon עם שבבי M2/M3/M4) או כרטיס מסך תואם (VRAM), כדי לאפשר הרצה מקומית חלקה של המודל.
  2. התנסו בכלים ידידותיים למשתמש: הורידו והריצו את המודל דרך פלטפורמות פשוטות לשימוש כמו LM Studio או Ollama. פלטפורמות אלו מאפשרות לטעון את משקלי המודל בלחיצת כפתור אחת ולהתחיל לעבוד איתו בסביבה סגורה ומאובטחת.
  3. הטמיעו את מודל Gemma באפליקציות שלכם: מפתחים יכולים להוריד את המשקלים של Gemma 4 12B ישירות מ-Hugging Face או Kaggle, ולהשתמש בספריית Unsloth כדי לבצע כוונון עדין (Fine-Tuning) מהיר וחסכוני של המודל לצרכים הספציפיים של העסק.
  4. חקרו את מאגר הכישורים של גוגל: השתמשו ב-Gemma Skills Repository החדש שגוגל שחררה. מאגר זה כולל ספריות קוד מוכנות שיסייעו לכם לבנות סוכנים אוטונומיים המסוגלים לבצע פעולות מורכבות, ניתוח נתונים וקבלת החלטות מבוססת מידע מקומי.

מבט קדימה: עתיד ה-AI המקומי לעסקים

שחרורו של Gemma 4 12B ברישיון קוד פתוח (Apache 2.0) מעניק לעסקים קטנים ובינוניים את הכוח להתחרות בארגוני ענק מבלי לשלם הון עתק על שרתי ענן. שילוב בין מודלים מקומיים קלים ומהירים לבין פלטפורמות כמו N8N או מערכות CRM חכמות, סולל את הדרך ליצירת סביבות עבודה עצמאיות לחלוטין המוגנות בפני דליפות מידע. החיסכון הכלכלי והביטחון המידעי הופכים את ה-Edge AI לסטנדרט החדש של עולם האוטומציה העסקית בשנים הקרובות.

שאלות ותשובות

FAQ

רוצים ליישם את זה בעסק שלכם?

באוטומציות AI אנחנו בונים סוכני AI ואוטומציות לעסקים בישראל. ראו את השירותים הרלוונטיים:

  • אוטומציה לעסקיםחיבור מערכות, חשבוניות ודשבורדים
  • בוט וואטסאפ לעסקWhatsApp Business API בישראל
  • סוכני AI לעסקיםסוכנים שמטפלים בלידים, שיחות ו-CRM
  • ניהול לידים אוטומטימענה מיידי, ניקוד וסינון אוטומטי

הכתבה הוכנה על-ידי המערכת בליווי בינה מלאכותית: תרגום, סיכום והוספת הקשר עסקי ישראלי מתוך פרסום מקורי של DeepMind. קראו על תהליך העריכה שלנו. קישור למקור המקורי.

אהבתם את הכתבה?

הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל

עוד מ־DeepMind

כל הכתבות מ־DeepMind
גוגל מציגה את DiffusionGemma: טכנולוגיית דיפוזיית טקסט מהירה פי 4
מוצר חדש
לפני 14 שעות
4 דקות
·מ־DeepMind

גוגל מציגה את DiffusionGemma: טכנולוגיית דיפוזיית טקסט מהירה פי 4

חברת גוגל (Google) השיקה את DiffusionGemma, מודל קוד פתוח ניסיוני מבוסס טכנולוגיית דיפוזיית טקסט המציע מהירות יצירת טקסט הגבוהה פי 4 בהשוואה למודלים אוטו-רגרסיביים מסורתיים. המודל, המבוסס על סדרת Gemma 4, משלב ארכיטקטורת Mixture of Experts (MoE) עם 26 מיליארד פרמטרים (מתוכם 3.8 מיליארד פעילים בהסקה) ומעבד פסקאות שלמות במקביל במקום מילה אחר מילה. תכונה זו פותרת את צווארי הבקבוק של חומרת קצה ומאפשרת ביצועים של מעל 1,000 אסימונים בשנייה על כרטיסי מסך ארגוניים. עבור עסקים בישראל, פריצת דרך זו מאפשרת הרצת יישומי בינה מלאכותית מקומיים ומאובטחים לחלוטין התואמים את חוק הגנת הפרטיות, ללא תלות בענן ציבורי.

GoogleGoogle DeepMindDiffusionGemma
קרא עוד
שילוב בינה מלאכותית פיזית ברובוטים: האקסלרטור של DeepMind
חדשות
אתמול
4 דקות
·מ־DeepMind

שילוב בינה מלאכותית פיזית ברובוטים: האקסלרטור של DeepMind

חברת Google DeepMind משיקה את ה-Google DeepMind Accelerator: Robotics, תוכנית האצה ייחודית בת שלושה חודשים המיועדת ל-15 סטארטאפים נבחרים באירופה בתחום הרובוטיקה הפיזית. התוכנית תעניק ליזמים מנטורשיפ צמוד וגישה ישירה למודלי ה-Gemini של גוגל ולשכבות הטכנולוגיה המתקדמות שלה. בין החברות שנבחרו ניתן למצוא סטארטאפים המפתחים פתרונות פורצי דרך בתחומי הבנייה, הרפואה, המיחזור וטכנולוגיות המישוש. המהלך מסמן פריצת דרך משמעותית בשילוב בינה מלאכותית פיזית ברובוטים, ומספק השראה רבה גם לתעשיית הראייה הממוחשבת והאוטומציה המקומית בישראל המבקשת ליישם טכנולוגיות דומות תחת רגולציית הפרטיות המקומית.

Google DeepMindGeminiTouchlab
קרא עוד
למידה מונחית בינה מלאכותית: המחקר החדש של Google DeepMind
מחקר
אתמול
4 דקות
·מ־DeepMind

למידה מונחית בינה מלאכותית: המחקר החדש של Google DeepMind

מחקר מבוקר רחב-היקף (RCT) שפורסם על ידי Google DeepMind בשיתוף עם משרד החינוך של סיירה לאון וארגון Fab AI מציג תוצאות פורצות דרך בשילוב בינה מלאכותית בלמידה. הניסוי, שנערך בקרב 1,763 תלמידים לאורך שמונה שבועות, בחן את מודל "הלמידה המונחית" (Guided Learning) המבוסס על Gemini. התוצאות הראו שיפור הישגים ממוצע של 0.258 סטיות תקן במתמטיקה – נתון המקביל לעד 2.5 שנות לימוד בכיתות שבהן המורים שילבו את הכלי באופן אינטנסיבי. במקום לשמש כמנוע תשובות פשוט, המודל הונחה לפעול בשיטה סוקרטית, ושלח שאלות מכוונות ב-76% מהאינטראקציות, בעוד שפתרונות ישירים סופקו ב-2% בלבד מהמקרים. המחקר מדגיש את הפוטנציאל העצום של סוכני AI מבוססי פדגוגיה בעיצוב מחדש של הדרכות והכשרות גם במגזר העסקי.

Google DeepMindGeminiFab AI
קרא עוד
הסייע הרפואי של Google DeepMind: מערכות בינה מלאכותית למרפאות פרטיות בישראל
מחקר
30 באפריל 2026
4 דקות
·מ־DeepMind

הסייע הרפואי של Google DeepMind: מערכות בינה מלאכותית למרפאות פרטיות בישראל

Google DeepMind חשפה את פרויקט "AI co-clinician", סוכן בינה מלאכותית מתקדם המיועד לעבוד בשיתוף פעולה לצד רופאים במרפאות ובסביבות טלמדיסין. בניגוד למערכות המבוססות על טקסט בלבד, המערכת החדשה פועלת על גבי מודלים מולטימודאליים המאפשרים לה לראות, לשמוע ולתקשר עם מטופלים בזמן אמת. במחקרי סימולציה מקיפים שכללו בדיקה של 140 מדדים קליניים, המערכת הציגה ביצועים ברמה המקבילה לרופאי משפחה ב-68 מהמדדים, ואף הצליחה להדריך מטופלים מרחוק בבדיקות פיזיות כמו שימוש נכון במשאף ואיתור פגיעות כתף. בעוד שהטכנולוגיה נמצאת עדיין בשלבי מחקר עולמי, היא מסמנת את הכיוון הברור אליו צועד ענף הרפואה: צמצום העומסים הקריטיים על הצוותים והכפלת יכולות הטיפול באמצעות סייעים דיגיטליים אמינים.

Google DeepMindWorld Health OrganizationMedPaLM
קרא עוד

עוד כתבות שיעניינו אותך

לכל הכתבות
גוגל מציגה את DiffusionGemma: טכנולוגיית דיפוזיית טקסט מהירה פי 4
מוצר חדש
לפני 14 שעות
4 דקות
·מ־DeepMind

גוגל מציגה את DiffusionGemma: טכנולוגיית דיפוזיית טקסט מהירה פי 4

חברת גוגל (Google) השיקה את DiffusionGemma, מודל קוד פתוח ניסיוני מבוסס טכנולוגיית דיפוזיית טקסט המציע מהירות יצירת טקסט הגבוהה פי 4 בהשוואה למודלים אוטו-רגרסיביים מסורתיים. המודל, המבוסס על סדרת Gemma 4, משלב ארכיטקטורת Mixture of Experts (MoE) עם 26 מיליארד פרמטרים (מתוכם 3.8 מיליארד פעילים בהסקה) ומעבד פסקאות שלמות במקביל במקום מילה אחר מילה. תכונה זו פותרת את צווארי הבקבוק של חומרת קצה ומאפשרת ביצועים של מעל 1,000 אסימונים בשנייה על כרטיסי מסך ארגוניים. עבור עסקים בישראל, פריצת דרך זו מאפשרת הרצת יישומי בינה מלאכותית מקומיים ומאובטחים לחלוטין התואמים את חוק הגנת הפרטיות, ללא תלות בענן ציבורי.

GoogleGoogle DeepMindDiffusionGemma
קרא עוד
השקת מודל הבינה המלאכותית Claude Fable 5: ביצועים ועקרונות בטיחות
מוצר חדש
אתמול
4 דקות
·מ־TechCrunch

השקת מודל הבינה המלאכותית Claude Fable 5: ביצועים ועקרונות בטיחות

חברת Anthropic השיקה רשמית את Claude Fable 5, הגרסה הציבורית הראשונה של מודל העל שלה Mythos. המודל החדש, המצטיין בכתיבת קוד ובמשימות אנליטיות מורכבות, מציע ביצועים חסרי תקדים שהשיגו 90% במבחני הביצועים של חברת Hex. יחד עם זאת, ההשקה מלווה במנגנוני בטיחות הדוקים החוסמים שימוש בתחומי סייבר וביולוגיה רגישים, ומעבירים את הטיפול ל-Opus 4.8. בנוסף, החברה מציגה מדיניות אבטחה חדשה ומחייבת של שמירת נתונים למשך 30 יום לכלל הלקוחות, ותמחור העומד על 10 דולרים למיליון טוקני קלט ו-50 דולרים למיליון טוקני פלט.

AnthropicClaudeClaude Fable 5
קרא עוד
מחשבי AI עם מעבדי RTX Spark: אנבידיה משנה את שוק המחשוב המקומי
מוצר חדש
3 ביוני 2026
4 דקות
·מ־Wired

מחשבי AI עם מעבדי RTX Spark: אנבידיה משנה את שוק המחשוב המקומי

ענקית השבבים Nvidia הציגה בתערוכת Computex 2026 את פלטפורמת RTX Spark – שבבי "סופר-צ'יפ" המשלבים מעבד מרכזי N1 בארכיטקטורת Arm, כרטיס מסך עוצמתי ממשפחת RTX וזיכרון מאוחד של עד 128 גיגה-בייט. הכרזה זו מסמנת את תחילתו של עידן ה-AI PC האמיתי, ומספקת לראשונה חלופת Windows עוצמתית למחשבי ה-MacBook Pro של אפל עבור מפתחים ועסקים המעוניינים להריץ מודלי שפה גדולים (LLMs) באופן מקומי לחלוטין. עם תמיכה מלאה בתשתית התוכנה CUDA, מחשבים אלו צפויים להציע ביצועי AI יוצאי דופן במחיר של כ-4,000 דולר לקונפיגורציות הקצה, ומביאים איתם בשורה של ממש לעסקים ישראליים הנדרשים לעמוד בחוקי הגנת הפרטיות הנוקשים.

NvidiaMicrosoftHP
קרא עוד
מערכת Data Formulator 0.7: מיקרוסופט חושפת AI לניתוח נתונים עסקיים
מוצר חדש
28 במאי 2026
4 דקות
·מ־Microsoft Research

מערכת Data Formulator 0.7: מיקרוסופט חושפת AI לניתוח נתונים עסקיים

מיקרוסופט הכריזה על שחרור גרסת 0.7 של פלטפורמת הקוד הפתוח Data Formulator. המערכת החדשה רותמת סוכני בינה מלאכותית מודעי-הקשר (Context-aware AI agents) במטרה לפשט תהליכי ניתוח נתונים מורכבים בארגונים. הפלטפורמה כוללת רכיב מתקדם של מחברי נתונים המאפשר הזרמת מידע באופן רציף ממסדי נתונים, קבצים מקומיים ומערכות בינה עסקית, תוך מניעת הצורך בעבודות אינטגרציה סיזיפיות מצד מחלקות ה-IT. בנוסף, סביבת העבודה הייחודית (Data Thread) מאפשרת למשתמשי הקצה לנהל שיח שוטף בשפה טבעית מול סוכני ה-AI, לתחקר נתונים, ליצור ויזואליזציות מתקדמות ולייעל את הליך קבלת ההחלטות העסקיות מבלי להזדקק לידע מוקדם בכתיבת קוד או שאילתות מורכבות.

MicrosoftData FormulatorGartner
קרא עוד