האם AI פותר בעיות מתמטיות פתוחות באופן עצמאי?

כן, 11 מתוך 15 בעיות ארדש חדשות מיוחסות למודלי AI כמו ChatGPT.

מה תפקיד כלי כמו Harmonic Aristotle?

הם מאוטמים הערכה פורמלית של הוכחות, מה שמקל על אימות פתרונות.

מה דעתו של טרנס טאו על ההתקדמות?

AI מתאים לפתרון 'זנב ארוך' של בעיות קלות יחסית באופן אוטונומי.

חדשות

מודלי AI פורצים בעיות מתמטיקה מתקדמות של ארדש

ChatGPT ומודלים מתקדמים פותרים 15 בעיות פתוחות – מה זה אומר לעתיד המחקר?

צוות אוטומציות AI

14 בינואר 2026

3 דקות קריאה

מבוסס על כתבה שלTechCrunch ↗תרגום, סיכום והקשר עסקי על-ידי המערכתאיך אנחנו עובדים

✨תקציר מנהלים

Key Takeaways

ניל סומאני גילה ש-ChatGPT פותר בעיית ארדש מורכבת ב-15 דקות.
מאז חג המולד, 15 בעיות ארדש נפתרו, 11 בעזרת AI.
טרנס טאו: AI מצטיין ב'זנב הארוך' של בעיות קלות יחסית.
כלי פורמליזציה כמו Lean ו-Aristotle מאיצים את התהליך.

מודלי AI פורצים בעיות מתמטיקה מתקדמות של ארדש

ניל סומאני גילה ש-ChatGPT פותר בעיית ארדש מורכבת ב-15 דקות.
מאז חג המולד, 15 בעיות ארדש נפתרו, 11 בעזרת AI.
טרנס טאו: AI מצטיין ב'זנב הארוך' של בעיות קלות יחסית.
כלי פורמליזציה כמו Lean ו-Aristotle מאיצים את התהליך.

בעידן שבו AI משנה את כללי המשחק במדע, מה אם מודלי שפה גדולים יפתרו בעיות מתמטיות פתוחות שמטרידות מדענים עשרות שנים? ניל סומאני, מהנדס תוכנה וחוקר כמותי לשעבר, גילה זאת במפתיע כשבדק את יכולות המתמטיקה של המודל החדש של OpenAI. לאחר 15 דקות של חשיבה, ChatGPT סיפק פתרון מלא לבעיה מורכבת, אותה אימת סומאני בכלי Harmonic. 'רציתי לבדוק מתי LLM יוכלו לפתור בעיות מתמטיות פתוחות', אמר סומאני.

הפתרון שהציע ChatGPT היה מרשים: הוא הזכיר אקסיומות מתמטיות כמו נוסחת לגנדר, משפט ברטראן ותורת כוכב דוד. בסופו של דבר, המודל מצא פוסט מ-Math Overflow מ-2013 של המתמטיקאי נועם אלקיס מהרווארד, אך הפתרון שלו שונה והשלים גרסה מלאה יותר של בעיה שהציב המתמטיקאי האגדי פול ארדש. ארדש השאיר אחריו אלפי השערות פתוחות, שמהוות אתגר מרכזי לבדיקת יכולות AI.

מאז חג המולד, 15 בעיות ארדש הועברו מ'פתוחות' ל'פתורות' באתר המוקדש להן, כאשר 11 מהפתרונות מייחסים תרומה ישירה למודלי AI. זה כולל פתרונות אוטונומיים מוקדמים כמו AlphaEvolve מבוסס Gemini, אך בעיקר הישגים של GPT 5.2, שסומאני מתאר כ'מיומן יותר בהיגיון מתמטי'. הכמות הגוברת של פתרונות כאלה מעלה שאלות על יכולת LLM לדחוף את גבולות הידע האנושי.

המתמטיקאי טרנס טאו מציג מבט מאוזן יותר: בדף GitHub שלו הוא מונה 8 בעיות שבהן AI השיג התקדמות אוטונומית משמעותית, ו-6 נוספות בהן סייע בחיפוש מחקר קיים. לדברי טאו, AI מתאים במיוחד ל'זנב הארוך' של בעיות ארדש הקלות יחסית, שפתרונן פשוט אך נדיר. 'בעיות כאלה סבירות יותר להיפתר על ידי AI טהור מאשר על ידי בני אדם או שיטות היברידיות', כתב טאו ב-Mastodon.

גורם מרכזי להתקדמות הוא המעבר להערכה פורמלית – תהליך עבודה שמאפשר אימות קל יותר של הוכחות. כלי כמו Lean, שפותח במחקר מיקרוסופט ב-2013, הפך פופולרי, ומודלי AI כמו Aristotle של Harmonic מאוטמים חלק ניכר מהעבודה. טודור אצ'ים, מייסד Harmonic, מדגיש שהשימוש בכלים אלה על ידי פרופסורים בכירים במתמטיקה ומדעי המחשב הוא עדות אמיתית להתקדמות.

עבור מנהלי עסקים וטכנולוגים ישראלים, ההישגים הללו מצביעים על פוטנציאל AI להאיץ מחקר ופיתוח. חברות כמו אינטל ומיקרוסופט כבר משלבות כלים כאלה, ובעידן שבו אוטומציה מתמטית יכולה לשנות תעשיות כמו פינטק וביוטק, כדאי לבחון כיצד לשלב מודלים מתקדמים בתהליכי חדשנות.

האם AI יחליף מתמטיקאים? עדיין לא, אבל הוא כבר משנה את הנוף. בדקו בעצמכם: נסו בעיה מתמטית פתוחה ב-ChatGPT וראו לאן הגענו.

שאלות ותשובות

FAQ

הכתבה הוכנה על-ידי המערכת בליווי בינה מלאכותית: תרגום, סיכום והוספת הקשר עסקי ישראלי מתוך פרסום מקורי של TechCrunch. קראו על תהליך העריכה שלנו. קישור למקור המקורי.

אהבתם את הכתבה?

הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל

עוד מ־TechCrunch

כל הכתבות מ־TechCrunch

אימוץ מודל קלוד במגזר העסקי: כיצד העימות עם הממשל משרת את אנתרופיק?

ניתוח

לפני 8 שעות

5 דקות

מ־TechCrunch

אימוץ מודל קלוד במגזר העסקי: כיצד העימות עם הממשל משרת את אנתרופיק?

מאבק משפטי ורגולטורי חדש בין ממשל טראמפ לחברת הבינה המלאכותית אנתרופיק (Anthropic) עשוי דווקא להגביר את הפופולריות שלה במגזר העסקי. לאחר שהממשל דרש לחסום גישת זרים למודלים החדשים Mythos 5 ו-Fable 5 בשל חששות אבטחה ויכולות כתיבת קוד מתקדמות, נאלצה החברה להסירם זמנית מהשוק. עם זאת, נתוני חברת Ramp המבוססים על מעל 70,000 עסקים מראים כי אנתרופיק עקפה לראשונה את OpenAI בנתח מנויי ה-AI העסקיים, והגיעה ל-41% בחודש מאי. הילה זו של מודל 'מסוכן ומאובטח מדי' מושכת ארגונים המעוניינים לשלב מודלי שפה חזקים, ומדגישה את הצורך של עסקים ישראליים בבניית תשתית מרובת מודלים גמישה וחסינה מפני שינויי רגולציה.

Anthropic OpenAI Ramp

קרא עוד

מערכת ההפעלה אנדרואיד 17 הושקה: כל החידושים וה-AI לעסקים

חדשות

לפני 12 שעות

4 דקות

מ־TechCrunch

מערכת ההפעלה אנדרואיד 17 הושקה: כל החידושים וה-AI לעסקים

גוגל השיקה באופן רשמי את גרסת ה-Final של מערכת ההפעלה אנדרואיד 17, המשלבת יכולות בינה מלאכותית מורחבות לצד עדכוני ממשק משמעותיים למשתמשי הקצה. המערכת, המגיעה ראשית למכשירי Pixel דרך חבילת Pixel Drop, מציגה שיתוף פעולה מובנה עם מודל ה-AI הרב-מודאלי Gemini Omni לעריכת וידאו אינטראקטיבית, כלי יצירת המוזיקה Lyria 3, ותרגום קולי מתקדם באמצעות מודל AudioLM. לצד ה-AI, גוגל מציגה את ממשק ה-Bubble Bar לשיפור המולטיטסקינג וניהול אפליקציות צפות בתחתית המסך, במטרה לייעל את סביבת העבודה הניידת ולקצר את זמני התגובה התפעוליים.

Google Android 17 Wear OS 7

קרא עוד

שילוב בינה מלאכותית במסרים שיווקיים פוגע באמון הלקוחות

מחקר

לפני 14 שעות

4 דקות

מ־TechCrunch

שילוב בינה מלאכותית במסרים שיווקיים פוגע באמון הלקוחות

סקר חדש של חברת WordPress VIP חושף כי 60% מהצרכנים בארה"ב מרגישים רתיעה ממותגים המשתמשים במילה "AI" במסרים השיווקיים שלהם. בעוד שחברות ממהרות לבצע אופטימיזציה למנועי חיפוש מבוססי בינה מלאכותית, פער האמון הולך וגדל: 86% מהצרכנים אינם נותנים אמון מלא בתשובות ה-AI ומעדיפים מקורות מידע מקוריים ואנושיים. המחקר מדגיש את החשיבות ההולכת וגוברת של שמירה על שקיפות וייחוס מקורות (Attribution) ברשת האינטרנט, המרגישה כיום 'פחות אנושית' עבור 74% מהגולשים. עבור עסקים ישראליים, הממצאים מהווים תמרור אזהרה מפני שיווק-יתר טכנולוגי ומדגישים את הצורך בשימור החיבור האנושי בקדמת הבמה, לצד שילוב אוטומציות חכמות מאחורי הקלעים.

WordPress VIP Automattic Brian Alvey

קרא עוד

SpaceX רוכשת את Cursor ב-60 מיליארד דולר במניות

חדשות

לפני 18 שעות

5 דקות

מ־TechCrunch

SpaceX רוכשת את Cursor ב-60 מיליארד דולר במניות

עסקת ענק דרמטית מרעידה את עולם הטכנולוגיה: חברת SpaceX של אילון מאסק הודיעה על רכישת סטארטאפ פיתוח הקוד Cursor (הידוע כ-Anysphere) בעסקת מניות בשווי של כ-60 מיליארד דולר. הרכישה מתבצעת ימים ספורים בלבד לאחר ההנפקה הציבורית ההיסטורית (IPO) של SpaceX, ונועדה להזניק את פעילות חטיבת הבינה המלאכותית של החברה. לפני העסקה, Cursor הייתה במסלול לגיוס הון של 2 מיליארד דולר לפי שווי של 50 מיליארד דולר ממשקיעים בולטים, בהם Nvidia ו-Thrive. המיזוג צפוי להיסגר ברבעון השלישי של שנת 2026 וישפיע ישירות על תעשיית פיתוח התוכנה ועל אבטחת המידע של ארגונים ברחבי העולם ובפרט בישראל.

SpaceX Cursor xAI

קרא עוד

עוד כתבות שיעניינו אותך

לכל הכתבות

חדשות

לפני 12 שעות

4 דקות

מ־TechCrunch

מערכת ההפעלה אנדרואיד 17 הושקה: כל החידושים וה-AI לעסקים

Google Android 17 Wear OS 7

קרא עוד

חדשות

לפני 18 שעות

5 דקות

מ־TechCrunch

SpaceX רוכשת את Cursor ב-60 מיליארד דולר במניות

SpaceX Cursor xAI

קרא עוד

ניהול שיחות לקוחות באוטומציה: Respond.io מגייסת 62.5 מיליון דולר

חדשות

אתמול

5 דקות

מ־TechCrunch

ניהול שיחות לקוחות באוטומציה: Respond.io מגייסת 62.5 מיליון דולר

חברת הסטארט-אפ המלאזית Respond.io השלימה סבב גיוס הון מרשים של 62.5 מיליון דולר (Series B) בהובלת Camber Partners. החברה, שמציגה קצב הכנסות שנתי (ARR) של 35 מיליון דולר וצמיחה של 169% שנה-על-שנה, מציעה פלטפורמה מתקדמת לניהול ערוצי תקשורת מרובים (כמו WhatsApp, אינסטגרם וטלגרם) המבוססת על סוכני בינה מלאכותית ואוטומציה. ייחודה של הפלטפורמה טמון במודל תמחור מבוסס נפח שיחות ולא לפי מושבי משתמשים, מה שמאפשר לעסקים לצמוח מבלי לספוג עלויות רישוי גבוהות על כל נציג שירות. המהלך מסמן את התעצמות המעבר של מותגי B2C לערוצי הודעות ישירים באוטומציה מלאה.

Respond.io Camber Partners Endeavor Catalyst

קרא עוד

עימות בצמרת ה-AI: הממשל האמריקאי מסרב להסיר את מגבלות הייצוא מ-Claude Fable 5

חדשות

אתמול

4 דקות

מ־Wired

עימות בצמרת ה-AI: הממשל האמריקאי מסרב להסיר את מגבלות הייצוא מ-Claude Fable 5

פגישת החירום בוושינגטון בין ראשי חברת Anthropic לממשל האמריקאי הסתיימה ללא פתרון למשבר Claude Fable 5. הממשל מסרב להסיר את מגבלות הייצוא החמורות שהוטלו על המודל החדש בשבוע שעבר עקב חששות מפרצות אבטחה המאפשרות מעקף (Jailbreaking) של מנגנוני הבטיחות. בבית הלבן וב-NSA חוששים כי משתמשים יוכלו לגשת ליכולות הסייבר והלחימה הבלתי-מפוקחות של מודל האם החסוי, Claude Mythos. חברות טכנולוגיה ומפתחי AI ברחבי העולם, ובהם גם עסקים ישראליים, עוקבים בדאגה אחר המהלך התקדימי, הממחיש את הסיכון הממשי שבהסתמכות על ספק AI יחיד ואת הצורך בבניית תשתית גיבוי מבוזרת ורב-מודלית לכל מערך האוטומציה בארגון.

Anthropic White House Claude Fable 5

קרא עוד