Ai2 משיקה Olmo 3.1: שיפורי RL דרמטיים בבינה מלאכותית
מוצר חדש

Ai2 משיקה Olmo 3.1: שיפורי RL דרמטיים בבינה מלאכותית

מכון Ai2 הרחיב אימון למידת חיזוק ב-21 ימים נוספים, ומשיג שיאים חדשים במבחני מתמטיקה, חשיבה והוראות

AI
אוטומציות AI
3 דקות קריאה

תקציר מנהלים

נקודות עיקריות

  • הארכת אימון RL ב-21 ימים הביאה לשיפורים של 5-20 נקודות במבחנים מרכזיים.

  • Olmo 3.1 Think 32B עלה על Qwen 3 וקרוב ל-Gemma 27B.

  • Olmo 3.1 Instruct 32B מוכן לצ'אט, כלים ודיאלוגים רב-תוריים.

  • זמין ב-Hugging Face עם מחויבות לשקיפות מלאה.

  • מתאים לעסקים: אימון מחדש ושליטה בנתונים.

בעולם שבו בינה מלאכותית הופכת לכלי עסקי קריטי, מכון Allen Institute for AI (Ai2) משיק את משפחת Olmo 3.1 – הדגמים החזקים ביותר שלו עד כה. הדגמים החדשים מתמקדים ביעילות, שקיפות ובקרה, ומציעים שיפורים משמעותיים במבחנים מאתגרים. Ai2 המשיכה את אימוני הלמידה בחיזוק (RL) של Olmo 3 Think 32B במשך 21 ימים נוספים על 224 כרטיסי מסך, מה שהוביל לפריצות דרך במתמטיקה, חשיבה והבנת הוראות. זהו צעד שמאפשר לעסקים ישראליים להתקדם בטכנולוגיות AI פתוחות. Ai2 עדכנה שניים משלושת הדגמים: Olmo 3.1 Think 32B, המותאם למחקר מתקדם, ו-Olmo 3.1 Instruct 32B, המיועד לעקוב אחר הוראות, דיאלוגים רב-תוריים ושימוש בכלים. הדגם השלישי, Olmo 3-Base, מתאים לתכנות, הבנה ומתמטיקה, ומשמש גם להמשך אימון. לפי Ai2, ההארכה באימון RL על נתוני Dolci-Think-RL הביאה לשיפורים של 5+ נקודות במבחן AIME, 4+ ב-ZebraLogic וב-IFEval, ו-20+ ב-IFBench, לצד ביצועים טובים יותר בקידוד ובמשימות מורכבות. עבור Olmo 3.1 Instruct 32B, Ai2 יישמה את המתכון שהצליח בדגם הקטן יותר 7B. הדגם החדש מותאם לצ'אט, שימוש בכלים ודיאלוגים רב-תוריים, והוא "האח הגדול המהימן יותר של Olmo 3 Instruct 7B, מוכן ליישומים בעולם האמיתי", כך מציינת Ai2. בנוסף, Ai2 שדרגה את דגמי RL-Zero 7B למתמטיקה וקידוד באמצעות אימונים ארוכים ויציבים יותר. Olmo 3.1 Think 32B עלה על Qwen 3 32B במבחן AIME 2025 והתקרב לביצועי Gemma 27B. Olmo 3.1 Instruct 32B התבלט מול עמיתיו בקוד פתוח, כולל ניצחון על Gemma 3 במבחן מתמטיקה. Ai2 מכנה אותו "הדגם הפתוח החזק ביותר בקנה מידה 32B להוראות". הדגמים זמינים כעת ב-Ai2 Playground וב-Hugging Face, עם גישה דרך API בקרוב. השקת Olmo 3.1 מדגישה את מחויבותה של Ai2 לשקיפות ולקוד פתוח. הדגמים מאפשרים לארגונים להוסיף נתונים משלהם ולאמן מחדש, תוך שימוש בכלי OlmoTrace שמעקב אחר התאמת הפלטים לנתוני האימון. זהו יתרון גדול לעסקים המחפשים שליטה מלאה במודלי AI, במיוחד בישראל שבה רגולציה על AI מתגברת. עבור מנהלי עסקים ישראליים, Olmo 3.1 פותח אפשרויות חדשות ליישומי AI פתוחים ויעילים. השיפורים בהיגיון ובמתמטיקה יכולים לשפר אוטומציה בתהליכים עסקיים, בעוד השקיפות מבטיחה עמידה בתקנים. כיצד תשלבו דגמים כאלה במערכות שלכם?

שאלות ותשובות

שאלות נפוצות

אהבתם את הכתבה?

הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל

עוד כתבות שיעניינו אותך

לכל הכתבות