מה השיפורים העיקריים ב-Olmo 3.1?

שיפורים של 5+ נקודות ב-AIME, 20+ ב-IFBench, וביצועים טובים יותר בקידוד וחשיבה.

איפה ניתן להוריד את הדגמים?

ב-Ai2 Playground וב-Hugging Face, עם API בקרוב.

מה יתרון השקיפות ב-Olmo?

אפשרות להוסיף נתונים ולאמן מחדש, עם כלי OlmoTrace למעקב.

מוצר חדש

Ai2 משיקה Olmo 3.1: שיפורי RL דרמטיים בבינה מלאכותית

מכון Ai2 הרחיב אימון למידת חיזוק ב-21 ימים נוספים, ומשיג שיאים חדשים במבחני מתמטיקה, חשיבה והוראות

צוות אוטומציות AI

13 בדצמבר 2025

3 דקות קריאה

מבוסס על כתבה שלVentureBeat ↗תרגום, סיכום והקשר עסקי על-ידי המערכתאיך אנחנו עובדים

✨תקציר מנהלים

נקודות עיקריות

הארכת אימון RL ב-21 ימים הביאה לשיפורים של 5-20 נקודות במבחנים מרכזיים.
Olmo 3.1 Think 32B עלה על Qwen 3 וקרוב ל-Gemma 27B.
Olmo 3.1 Instruct 32B מוכן לצ'אט, כלים ודיאלוגים רב-תוריים.
זמין ב-Hugging Face עם מחויבות לשקיפות מלאה.
מתאים לעסקים: אימון מחדש ושליטה בנתונים.

Ai2 משיקה Olmo 3.1: שיפורי RL דרמטיים בבינה מלאכותית

הארכת אימון RL ב-21 ימים הביאה לשיפורים של 5-20 נקודות במבחנים מרכזיים.
Olmo 3.1 Think 32B עלה על Qwen 3 וקרוב ל-Gemma 27B.
Olmo 3.1 Instruct 32B מוכן לצ'אט, כלים ודיאלוגים רב-תוריים.
זמין ב-Hugging Face עם מחויבות לשקיפות מלאה.
מתאים לעסקים: אימון מחדש ושליטה בנתונים.

בעולם שבו בינה מלאכותית הופכת לכלי עסקי קריטי, מכון Allen Institute for AI (Ai2) משיק את משפחת Olmo 3.1 – הדגמים החזקים ביותר שלו עד כה. הדגמים החדשים מתמקדים ביעילות, שקיפות ובקרה, ומציעים שיפורים משמעותיים במבחנים מאתגרים. Ai2 המשיכה את אימוני הלמידה בחיזוק (RL) של Olmo 3 Think 32B במשך 21 ימים נוספים על 224 כרטיסי מסך, מה שהוביל לפריצות דרך במתמטיקה, חשיבה והבנת הוראות. זהו צעד שמאפשר לעסקים ישראליים להתקדם בטכנולוגיות AI פתוחות.

Ai2 עדכנה שניים משלושת הדגמים: Olmo 3.1 Think 32B, המותאם למחקר מתקדם, ו-Olmo 3.1 Instruct 32B, המיועד לעקוב אחר הוראות, דיאלוגים רב-תוריים ושימוש בכלים. הדגם השלישי, Olmo 3-Base, מתאים לתכנות, הבנה ומתמטיקה, ומשמש גם להמשך אימון. לפי Ai2, ההארכה באימון RL על נתוני Dolci-Think-RL הביאה לשיפורים של 5+ נקודות במבחן AIME, 4+ ב-ZebraLogic וב-IFEval, ו-20+ ב-IFBench, לצד ביצועים טובים יותר בקידוד ובמשימות מורכבות.

עבור Olmo 3.1 Instruct 32B, Ai2 יישמה את המתכון שהצליח בדגם הקטן יותר 7B. הדגם החדש מותאם לצ'אט, שימוש בכלים ודיאלוגים רב-תוריים, והוא "האח הגדול המהימן יותר של Olmo 3 Instruct 7B, מוכן ליישומים בעולם האמיתי", כך מציינת Ai2. בנוסף, Ai2 שדרגה את דגמי RL-Zero 7B למתמטיקה וקידוד באמצעות אימונים ארוכים ויציבים יותר.

Olmo 3.1 Think 32B עלה על Qwen 3 32B במבחן AIME 2025 והתקרב לביצועי Gemma 27B. Olmo 3.1 Instruct 32B התבלט מול עמיתיו בקוד פתוח, כולל ניצחון על Gemma 3 במבחן מתמטיקה. Ai2 מכנה אותו "הדגם הפתוח החזק ביותר בקנה מידה 32B להוראות". הדגמים זמינים כעת ב-Ai2 Playground וב-Hugging Face, עם גישה דרך API בקרוב.

השקת Olmo 3.1 מדגישה את מחויבותה של Ai2 לשקיפות ולקוד פתוח. הדגמים מאפשרים לארגונים להוסיף נתונים משלהם ולאמן מחדש, תוך שימוש בכלי OlmoTrace שמעקב אחר התאמת הפלטים לנתוני האימון. זהו יתרון גדול לעסקים המחפשים שליטה מלאה במודלי AI, במיוחד בישראל שבה רגולציה על AI מתגברת.

עבור מנהלי עסקים ישראליים, Olmo 3.1 פותח אפשרויות חדשות ליישומי AI פתוחים ויעילים. השיפורים בהיגיון ובמתמטיקה יכולים לשפר אוטומציה בתהליכים עסקיים, בעוד השקיפות מבטיחה עמידה בתקנים. כיצד תשלבו דגמים כאלה במערכות שלכם?

שאלות ותשובות

שאלות נפוצות

הכתבה הוכנה על-ידי המערכת בליווי בינה מלאכותית: תרגום, סיכום והוספת הקשר עסקי ישראלי מתוך פרסום מקורי של VentureBeat. קראו על תהליך העריכה שלנו. קישור למקור המקורי.

אהבתם את הכתבה?

הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל

עוד מ־VentureBeat

כל הכתבות מ־VentureBeat

Railway גייסה 100 מיליון דולר לאתגר את AWS בתשתית ענן AI

חדשות

22 בינואר 2026

4 דקות

מ־VentureBeat

Railway גייסה 100 מיליון דולר לאתגר את AWS בתשתית ענן AI

Railway גייסה 100 מיליון דולר לפלטפורמת ענן AI מהירה שמאתגרת את AWS. פריסות בשנייה, חיסכון 65% ו-2 מיליון משתמשים. קראו עכשיו על המהפכה!

Railway Jake Cooper TQ Ventures

קרא עוד

Listen Labs גייסה 69 מיליון דולר אחרי קמפיין שילוט ויראלי

חדשות

16 בינואר 2026

4 דקות

מ־VentureBeat

Listen Labs גייסה 69 מיליון דולר אחרי קמפיין שילוט ויראלי

אלפרד וולפורס מ-Listen Labs השתמש בלוח מודעות ויראלי כדי לגייס כישרונות, וכעת החברה גייסה 69 מיליון דולר. הפלטפורמה מבצעת ראיונות לקוחות AI מהירים ומדויקים, פותרת בעיות הונאה ומשמשת מיקרוסופט ועוד. קראו עכשיו על השינוי במחקר שוק!

Listen Labs Alfred Wahlforss Ribbit Capital

קרא עוד

סיילספורס משיקה סלאקבוט חדש: סוכן AI עוצמתי לעבודה

מוצר חדש

13 בינואר 2026

4 דקות

מ־VentureBeat

סיילספורס משיקה סלאקבוט חדש: סוכן AI עוצמתי לעבודה

סיילספורס השיקה סלאקבוט חדש כסוכן AI שמשנה את חוקי המשחק בעבודה. הוא מחפש נתונים, כותב מסמכים ומבצע פעולות – זמין ללא עלות נוספת. קראו עכשיו על הביצועים המרשימים בבדיקות.

Salesforce Slack Slackbot

קרא עוד

אנטרופיק משיקה Cowork: סוכן AI לשולחן העבודה ללא קוד

מוצר חדש

13 בינואר 2026

4 דקות

מ־VentureBeat

אנטרופיק משיקה Cowork: סוכן AI לשולחן העבודה ללא קוד

אנטרופיק משיקה Cowork, סוכן AI חדש שמאפשר למשתמשים רגילים לבצע משימות על קבצים במחשב ללא קוד. הכלי נבנה תוך שבועיים בעזרת Claude Code ומבטיח פרודוקטיביות גבוהה יותר. קראו את המאמר המלא עכשיו!

Anthropic Claude Cowork

קרא עוד

עוד כתבות שיעניינו אותך

לכל הכתבות

מחשבי AI עם מעבדי RTX Spark: אנבידיה משנה את שוק המחשוב המקומי

מוצר חדש

לפני 5 ימים

4 דקות

מ־Wired

מחשבי AI עם מעבדי RTX Spark: אנבידיה משנה את שוק המחשוב המקומי

ענקית השבבים Nvidia הציגה בתערוכת Computex 2026 את פלטפורמת RTX Spark – שבבי "סופר-צ'יפ" המשלבים מעבד מרכזי N1 בארכיטקטורת Arm, כרטיס מסך עוצמתי ממשפחת RTX וזיכרון מאוחד של עד 128 גיגה-בייט. הכרזה זו מסמנת את תחילתו של עידן ה-AI PC האמיתי, ומספקת לראשונה חלופת Windows עוצמתית למחשבי ה-MacBook Pro של אפל עבור מפתחים ועסקים המעוניינים להריץ מודלי שפה גדולים (LLMs) באופן מקומי לחלוטין. עם תמיכה מלאה בתשתית התוכנה CUDA, מחשבים אלו צפויים להציע ביצועי AI יוצאי דופן במחיר של כ-4,000 דולר לקונפיגורציות הקצה, ומביאים איתם בשורה של ממש לעסקים ישראליים הנדרשים לעמוד בחוקי הגנת הפרטיות הנוקשים.

Nvidia Microsoft HP

קרא עוד

מערכת Data Formulator 0.7: מיקרוסופט חושפת AI לניתוח נתונים עסקיים

מוצר חדש

28 במאי 2026

4 דקות

מ־Microsoft Research

מערכת Data Formulator 0.7: מיקרוסופט חושפת AI לניתוח נתונים עסקיים

מיקרוסופט הכריזה על שחרור גרסת 0.7 של פלטפורמת הקוד הפתוח Data Formulator. המערכת החדשה רותמת סוכני בינה מלאכותית מודעי-הקשר (Context-aware AI agents) במטרה לפשט תהליכי ניתוח נתונים מורכבים בארגונים. הפלטפורמה כוללת רכיב מתקדם של מחברי נתונים המאפשר הזרמת מידע באופן רציף ממסדי נתונים, קבצים מקומיים ומערכות בינה עסקית, תוך מניעת הצורך בעבודות אינטגרציה סיזיפיות מצד מחלקות ה-IT. בנוסף, סביבת העבודה הייחודית (Data Thread) מאפשרת למשתמשי הקצה לנהל שיח שוטף בשפה טבעית מול סוכני ה-AI, לתחקר נתונים, ליצור ויזואליזציות מתקדמות ולייעל את הליך קבלת ההחלטות העסקיות מבלי להזדקק לידע מוקדם בכתיבת קוד או שאילתות מורכבות.

Microsoft Data Formulator Gartner

קרא עוד

מודלי שפה למק: הפתרון המקומי והעסקי של פלטפורמת Osaurus

מוצר חדש

15 במאי 2026

4 דקות

מ־TechCrunch

מודלי שפה למק: הפתרון המקומי והעסקי של פלטפורמת Osaurus

פלטפורמת Osaurus מציגה פתרון פורץ דרך למשתמשי מחשבי מק, ומאפשרת למנהלים בחברות ועסקים להריץ מודלי בינה מלאכותית באופן מקומי לחלוטין וללא תלות בשרתי ענן חיצוניים. מטרת הפלטפורמה, שזכתה כבר ליותר מ-112,000 הורדות מאז עלייתה לרשת, היא לנתק את התלות בעלויות האסימונים (Tokens) של חברות הענק ולאפשר שמירה מקסימלית על פרטיות המידע העסקי, תכונה קריטית במיוחד לארגונים הכפופים לחוק הגנת הפרטיות בישראל. בעזרת טכנולוגיית "ארגז חול" המבודדת את הבינה המלאכותית מקבצי המערכת, יחד עם למעלה מ-20 תוספים מובנים לאפליקציות שולחניות כמו דוא"ל, יומן ומערכת קבצים, פלטפורמת הקוד הפתוח פותחת צוהר לעידן חדש של אבטחת מידע בארגונים בישראל.

Osaurus Apple OpenAI

קרא עוד

סוכני בינה מלאכותית בנושן: הפלטפורמה שהופכת למרכז אוטומציה

מוצר חדש

13 במאי 2026

4 דקות

מ־TechCrunch

סוכני בינה מלאכותית בנושן: הפלטפורמה שהופכת למרכז אוטומציה

חברת נושן (Notion) עושה צעד דרמטי אל עבר עולם האוטומציה הארגונית עם השקת פלטפורמת מפתחים חדשה. הפיתוח מיועד לחבר סוכני בינה מלאכותית אל מסדי נתונים חיצוניים כגון Salesforce ו-Zendesk, ולמעשה להפוך את סביבת העבודה הפופולרית למערכת תזמור מתקדמת. באמצעות מנגנון ארגז חול חדש בשם Workers, חברות יוכלו מעתה להריץ קוד מותאם אישית ישירות מתוך המערכת מבלי להישען על תשתיות ענן חיצוניות. המהלך מאפשר גם תקשורת רציפה עם סוכני AI מבוקשים כמו Claude ו-Cursor באמצעות תמיכה בפרוטוקול MCP. פיתוחים אלו מסמנים את המעבר של החברה מאפליקציית כתיבה לתשתית מרכזית לתפעול העסק כולו, כאשר המערכת פתוחה לשימוש נסיוני בחינם עד חודש אוגוסט.

Notion Salesforce Zendesk

קרא עוד