Nous Research משיקה Nomos 1: AI שמדורג שני בתחרות פוטנם
מוצר חדש

Nous Research משיקה Nomos 1: AI שמדורג שני בתחרות פוטנם

מערכת חשיבה מתמטית פתוחה קומפקטית כובשת ציון 87 בתחרות האוניברסיטאית הקשה בעולם ומציבה אתגר לענקיות הטכנולוגיה

AI
אוטומציות AI
4 דקות קריאה

תקציר מנהלים

נקודות עיקריות

  • Nomos 1 השיגה 87/120 בפוטנם 2024, מקום 2 מתוך 3988 משתתפים.

  • מבוססת Qwen3-30B קומפקטי, עם מאמנת חשיבה בשני שלבים.

  • עולה על מודל הבסיס (24 נקודות) בזכות אופטימיזציה פוסט-אימון.

  • פתוחה ונגישה, בניגוד למודלים ענקיים של DeepSeek וגוגל.

  • יישומים עסקיים: אימות, הוכחות, מודלים מדעיים.

בעידן שבו בינה מלאכותית צריכה לפתור בעיות מתמטיות מורכבות כמו בני אדם, Nous Research, סטארט-אפ מסן פרנסיסקו, משיקה את Nomos 1 – מערכת חשיבה מתמטית פתוחה שזוכה בציון 87 מתוך 120 בתחרות וויליאם לוול פוטנם 2024. ציון זה היה מדרג אותה במקום השני מתוך 3,988 משתתפים, כשהציון הגבוה ביותר של בני אדם היה 90 והחציון רק 2. ההישג מדגיש את הפוטנציאל של מודלים קטנים יחסית להתחרות בענקים. Nous Research מדווחת כי Nomos 1 מבוסס על מודל Qwen3-30B של Alibaba עם 30 מיליארד פרמטרים, כאשר רק 3 מיליארד פעילים בכל רגע נתון במבנה תערובת-מומחים. המודל הבסיסי בלבד השיג רק 24 נקודות באותו מבחן, מה שמוכיח את חשיבות האופטימיזציה שלאחר האימון ואיכות הנתונים. Nomos 1 השיגה 8 תשובות מושלמות מתוך 12, והתוצאות אומתו על ידי מומחה אנושי שסיים בין 200 הראשונים בפוטנם בעבר. המערכת פועלת בשתי שלבים בתוך 3 שעות, בדומה לתחרות האמיתית: שלב פתרון שבו עובדים מקביליים בוחרים בעיות קשות, מייצרים פתרונות ומדרגים אותם עצמית מ-1 עד 7, ומתמקדים בבעיות עם מעט הצלחות. בשלב הסיום, 15 דקות לפני הזמן, מתבצעת התלכדות של תשובות לפי מסקנות וטורניר זוגי לבחירת הפתרון הסופי. הכל זמין בקוד פתוח ב-GitHub. תחרות הפוטנם נחשבת לבחינה המאתגרת ביותר לסטודנטים בארה"ב ובקנדה, עם 12 שאלות חידה-דמויות בשתי ישיבות של 3 שעות. 61% מהמשתתפים השיגו 3 נקודות או פחות. מנצחים רבים הפכו למתמטיקאים מפורסמים, כולל זוכי מדליות פילדס ונובל. Nomos 1 מציבה קנה מידה חדש לבינה מלאכותית מתמטית. בהשוואה למתחרים, DeepSeekMath-V2 השיגה 118/120 על שאלות פוטנם 2024 ומדליות זהב באולימפיאדת מתמטיקה בינלאומית. גוגל ג'מיני ייצרה הוכחות טבעיות בתוך הזמן. אך Nomos 1 בולטת בנגישות: רצה על חומרה צרכנית, בניגוד לענקים של OpenAI וגוגל הדורשים מחשבים ענקיים. זה מאפשר לארגונים להשתמש בה ללא תלות בענן. השקת Nomos 1 מגיעה שבוע אחרי Hermes 4.3 של אותה חברה, מודל כללי שאומן ברשת מבוזרת Psyche על בלוקצ'יין Solana והצטיין בבנצ'מרק RefusalBench. שתי ההשקות מוכיחות הימור אסטרטגי: מודלים קטנים עם טכניקות חכמות מאיימים על מודלים טריליון-פרמטרים. עבור מנהלי עסקים ישראלים, זה פותח אפשרויות באימות פורמלי, מודלים מדעיים וניתוח קריפטוגרפי. המרוץ לבניית 'מתמטיקאי AI' מאיץ: התחרות התקיימה ב-6 בדצמבר 2025, והמודל שוחרר 3 ימים אחרי. עם תורמים כמו Roger Jin ו-Hillclimb AI, Nomos 1 זמינה תחת רישיון Apache 2.0 ב-Hugging Face. ארגונים יכולים כעת להריץ מתמטיקאי AI על לפטופ – צעד שמקרב את הטכנולוגיה לשימוש יומיומי. מה זה אומר לעתיד? האם מודלים פתוחים קטנים ידיחו את הענקים? מנהלים צריכים לבחון כיצד לשלב יכולות כאלה בפיתוח תוכנה ובמחקר.

שאלות ותשובות

שאלות נפוצות

אהבתם את הכתבה?

הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל

עוד כתבות שיעניינו אותך

לכל הכתבות