דלג לתוכן הראשי
אוטומציות AI - לוגו
  • דף הבית
  • בלוג
  • חדשות
  • אודות
  • צור קשר
03-7630715קבעו ייעוץ חינם
אוטומציות AI - פתרונות אוטומציה וסוכני AI לעסקים בישראל

בונים סוכני AI ואוטומציות לעסקים בישראל: וואטסאפ, CRM, לידים, תורים, חשבוניות, דשבורדים וחיבור מערכות.

IL03-7630715USA(646) 760-4854info@automaziot.ai
אחד העם 9, תל אביב. מגדל שלום

קישורים מהירים

  • דף הבית
  • בלוג
  • חדשות
  • אודות
  • צור קשר
  • סיפורי הצלחה
  • מילון מונחים

הפתרונות שלנו

  • ניהול לידים אוטומטי
  • סוכן חכם לוואטסאפ
  • חיבור מערכות ודשבורדים
  • ניהול לקוחות חכם
  • קביעת תורים אוטומטית
  • מכירות ושירות לקוחות
  • אוטומציה לאיקומרס
  • סוכני AI
  • ייעוץ אוטומציה

הישארו מעודכנים

הירשמו לניוזלטר וקבלו עדכונים על חידושים בעולם האוטומציה וה-AI

FacebookInstagramLinkedIn

אתר זה משתמש ב-Google Analytics ו-Vercel Analytics לשיפור השירות. למידע מלא ראה מדיניות פרטיות

© 2026 אוטומציות AI. כל הזכויות שמורות.

מדיניות פרטיותתנאי שימושהצהרת נגישותמדיניות עריכה
חדשותvLLM
TOPIC

vLLM

כל החדשות והניתוחים שלנו בנושא vLLM — מתורגמים ומסוכמים ממקורות מובילים בעולם, עם הקשר עסקי ישראלי. 8 כתבות.

גוגל מציגה את DiffusionGemma: טכנולוגיית דיפוזיית טקסט מהירה פי 4
מוצר חדש
לפני 5 ימים
4 דקות
·מ־DeepMind

גוגל מציגה את DiffusionGemma: טכנולוגיית דיפוזיית טקסט מהירה פי 4

חברת גוגל (Google) השיקה את DiffusionGemma, מודל קוד פתוח ניסיוני מבוסס טכנולוגיית דיפוזיית טקסט המציע מהירות יצירת טקסט הגבוהה פי 4 בהשוואה למודלים אוטו-רגרסיביים מסורתיים. המודל, המבוסס על סדרת Gemma 4, משלב ארכיטקטורת Mixture of Experts (MoE) עם 26 מיליארד פרמטרים (מתוכם 3.8 מיליארד פעילים בהסקה) ומעבד פסקאות שלמות במקביל במקום מילה אחר מילה. תכונה זו פותרת את צווארי הבקבוק של חומרת קצה ומאפשרת ביצועים של מעל 1,000 אסימונים בשנייה על כרטיסי מסך ארגוניים. עבור עסקים בישראל, פריצת דרך זו מאפשרת הרצת יישומי בינה מלאכותית מקומיים ומאובטחים לחלוטין התואמים את חוק הגנת הפרטיות, ללא תלות בענן ציבורי.

GoogleGoogle DeepMindDiffusionGemma
קרא עוד
מודל Gemma 4 12B: גוגל משיקה בינה מלאכותית מולטי-מודאלית מקומית
מוצר חדש
9 ביוני 2026
4 דקות
·מ־DeepMind

מודל Gemma 4 12B: גוגל משיקה בינה מלאכותית מולטי-מודאלית מקומית

גוגל דיפמיינד (Google DeepMind) השיקה את Gemma 4 12B, מודל בינה מלאכותית פתוח ומולטי-מודאלי המיועד להרצה מקומית על מחשבים ניידים עם זיכרון של 16GB בלבד. המודל החדש מציג ארכיטקטורה חדשנית נטולת מקודדים (Encoder-free), המאפשרת עיבוד ישיר ומהיר של קלט חזותי וקולי בתוך מודל השפה ללא תוספת השהיה או זיכרון. עם ביצועים המתקרבים למודלים הגדולים בהרבה ומעל 150 מיליון הורדות למשפחת המודלים כולה, גוגל מנגישה יכולות עיבוד מתקדמות וסוכני AI אוטונומיים לחומרה מקומית יומיומית, ברישיון קוד פתוח חופשי (Apache 2.0).

Google DeepMindGemma 4 12BApache 2.0
קרא עוד
סטארטאפים ב-Google Cloud Next 2026: מה זה אומר לעסקים
ניתוח
22 באפריל 2026
5 דקות
·מ־TechCrunch

סטארטאפים ב-Google Cloud Next 2026: מה זה אומר לעסקים

**Google Cloud Next 2026 מסמן מעבר מהייפ סביב מודלים למיקוד עסקי בסוכני AI.** לפי הדיווח, Google הקצתה 750 מיליון דולר כדי לעזור לשותפים למכור AI agents לארגונים, כולל מימון ל-proof-of-concept, קרדיטי ענן ומהנדסים מלווים. זה חשוב לעסקים בישראל כי השאלה כבר אינה איזה מודל הכי מרשים, אלא איזה פתרון מתחבר ל-WhatsApp, ל-CRM ולתהליכים קיימים. הלקח המעשי ברור: להתחיל בפיילוט ממוקד של 2-4 שבועות, למדוד KPI אחד כמו זמן תגובה או המרת לידים, ולחבר את המערכת ל-Zoho CRM ו-N8N לפני הרחבה. בענפים כמו נדל"ן, ביטוח ומרפאות, זה יכול להפוך פניות לא מובנות לתהליך מכירה ושירות מדיד.

Google CloudGoogle Cloud NextGoogle
קרא עוד
Gemma 4 לעסקים: מודל פתוח לסוכנים ויישומים מקומיים
ניתוח
2 באפריל 2026
6 דקות
·מ־DeepMind

Gemma 4 לעסקים: מודל פתוח לסוכנים ויישומים מקומיים

**Gemma 4 הוא דור חדש של מודלים פתוחים מגוגל, שנועד להסקה מתקדמת, סוכנים אוטונומיים והרצה מקומית על חומרה נגישה.** לפי גוגל, המשפחה כוללת 4 דגמים, חלון הקשר של עד 256K, תמיכה ב-140+ שפות ורישיון Apache 2.0. עבור עסקים בישראל, החשיבות איננה רק בביצועי המודל אלא ביכולת לחבר אותו לתהליכים אמיתיים: קבלת פניות ב-WhatsApp, חילוץ נתונים ב-JSON, עדכון Zoho CRM ותזמור ב-N8N. הענפים שיכולים להרוויח ראשונים הם משרדי עורכי דין, מרפאות, ביטוח ונדל"ן — במיוחד במקרים שבהם פרטיות, עברית מקצועית וזמני תגובה קצרים חשובים יותר מגישה בלעדית לענן.

GoogleGoogle DeepMindGemma 4
קרא עוד
ספקולטיב דיקודינג עם Hidden State: איך להאיץ LLM פי 3.3
מחקר
8 במרץ 2026
6 דקות
·מ־arXiv cs.AI

ספקולטיב דיקודינג עם Hidden State: איך להאיץ LLM פי 3.3

**ספקולטיב דיקודינג עם Hidden State הוא גישה שממחזרת חישוב שנכשל במקום לזרוק אותו, ובכך עשויה להאיץ מודלי שפה גדולים עד פי 3.3 לפי מאמר חדש ב-arXiv.** עבור עסקים ישראליים, המשמעות אינה רק טכנית: אם מנועי inference יהפכו יעילים יותר, אפשר יהיה לקצר זמני תגובה ב-WhatsApp, להפעיל יותר שיחות על אותה תשתית, ולחבר AI בצורה כלכלית יותר ל-Zoho CRM ול-N8N. חשוב לזכור שמדובר כרגע במחקר ולא במוצר מסחרי זמין, אבל הכיוון ברור: התחרות ב-AI תעבור יותר ויותר דרך עלות וזמן תגובה, לא רק דרך איכות המודל.

Speculative DecodingHidden StateGartner
קרא עוד
Inferact גייסה 150 מיליון להמרצת vLLM
חדשות
22 בינואר 2026
2 דקות
·מ־TechCrunch

Inferact גייסה 150 מיליון להמרצת vLLM

סטארט-אפ ההסקה Inferact גייס 150 מיליון דולר בשווי 800 מיליון להמרצת vLLM. קראו על המגמה החדשה בתשתיות AI. קראו עכשיו המלא.

InferactvLLMAndreessen Horowitz
קרא עוד
RadixArk: SGLang הופכת לסטארט-אפ בשווי 400 מיליון דולר
חדשות
22 בינואר 2026
3 דקות
·מ־TechCrunch

RadixArk: SGLang הופכת לסטארט-אפ בשווי 400 מיליון דולר

בעידן שבו עלויות ההסקה של מודלי AI מהוות חלק ניכר מעלויות השרתים, RadixArk מציגה פתרון מהפכני. קראו עכשיו על הסטארט-אפ החדש בשווי 400 מיליון דולר.

RadixArkSGLangYing Sheng
קרא עוד
FlashInfer-Bench: מחזור וירטואוזי לשיפור LLM
מחקר
5 בינואר 2026
3 דקות
·מ־arXiv cs.AI

FlashInfer-Bench: מחזור וירטואוזי לשיפור LLM

FlashInfer-Bench מציגה מסגרת סגורה לשילוב קרנלי GPU שנוצרו על ידי LLM במערכות ייצור. קראו על הכלים החדשים לבנצ'מרק והפריסה.

FlashInfer-BenchFlashInfer TraceSGLang
קרא עוד
vLLM — חדשות AI ואוטומציה | אוטומציות AI