בעידן שבו AI משנה את כללי המשחק במדע, מה אם מודלי שפה גדולים יפתרו בעיות מתמטיות פתוחות שמטרידות מדענים עשרות שנים? ניל סומאני, מהנדס תוכנה וחוקר כמותי לשעבר, גילה זאת במפתיע כשבדק את יכולות המתמטיקה של המודל החדש של OpenAI. לאחר 15 דקות של חשיבה, ChatGPT סיפק פתרון מלא לבעיה מורכבת, אותה אימת סומאני בכלי Harmonic. 'רציתי לבדוק מתי LLM יוכלו לפתור בעיות מתמטיות פתוחות', אמר סומאני.
הפתרון שהציע ChatGPT היה מרשים: הוא הזכיר אקסיומות מתמטיות כמו נוסחת לגנדר, משפט ברטראן ותורת כוכב דוד. בסופו של דבר, המודל מצא פוסט מ-Math Overflow מ-2013 של המתמטיקאי נועם אלקיס מהרווארד, אך הפתרון שלו שונה והשלים גרסה מלאה יותר של בעיה שהציב המתמטיקאי האגדי פול ארדש. ארדש השאיר אחריו אלפי השערות פתוחות, שמהוות אתגר מרכזי לבדיקת יכולות AI.
מאז חג המולד, 15 בעיות ארדש הועברו מ'פתוחות' ל'פתורות' באתר המוקדש להן, כאשר 11 מהפתרונות מייחסים תרומה ישירה למודלי AI. זה כולל פתרונות אוטונומיים מוקדמים כמו AlphaEvolve מבוסס Gemini, אך בעיקר הישגים של GPT 5.2, שסומאני מתאר כ'מיומן יותר בהיגיון מתמטי'. הכמות הגוברת של פתרונות כאלה מעלה שאלות על יכולת LLM לדחוף את גבולות הידע האנושי.
המתמטיקאי טרנס טאו מציג מבט מאוזן יותר: בדף GitHub שלו הוא מונה 8 בעיות שבהן AI השיג התקדמות אוטונומית משמעותית, ו-6 נוספות בהן סייע בחיפוש מחקר קיים. לדברי טאו, AI מתאים במיוחד ל'זנב הארוך' של בעיות ארדש הקלות יחסית, שפתרונן פשוט אך נדיר. 'בעיות כאלה סבירות יותר להיפתר על ידי AI טהור מאשר על ידי בני אדם או שיטות היברידיות', כתב טאו ב-Mastodon.
גורם מרכזי להתקדמות הוא המעבר להערכה פורמלית – תהליך עבודה שמאפשר אימות קל יותר של הוכחות. כלי כמו Lean, שפותח במחקר מיקרוסופט ב-2013, הפך פופולרי, ומודלי AI כמו Aristotle של Harmonic מאוטמים חלק ניכר מהעבודה. טודור אצ'ים, מייסד Harmonic, מדגיש שהשימוש בכלים אלה על ידי פרופסורים בכירים במתמטיקה ומדעי המחשב הוא עדות אמיתית להתקדמות.
עבור מנהלי עסקים וטכנולוגים ישראלים, ההישגים הללו מצביעים על פוטנציאל AI להאיץ מחקר ופיתוח. חברות כמו אינטל ומיקרוסופט כבר משלבות כלים כאלה, ובעידן שבו אוטומציה מתמטית יכולה לשנות תעשיות כמו פינטק וביוטק, כדאי לבחון כיצד לשלב מודלים מתקדמים בתהליכי חדשנות.
האם AI יחליף מתמטיקאים? עדיין לא, אבל הוא כבר משנה את הנוף. בדקו בעצמכם: נסו בעיה מתמטית פתוחה ב-ChatGPT וראו לאן הגענו.