מחקר
2 דקות
מ־arXiv cs.AI
בנצ'מרק חדש: Gemini ו-Claude מצטיינים בהוכחות מתמטיות ברמת דוקטורט
מחקר חדש ב-arXiv בודק מודלי LLM מתקדמים על הוכחות מתמטיות מספר אלגוריתמים רנדומליים. Gemini ו-Claude מובילים עם 66% דיוק. קראו עכשיו לפרטים מלאים.
קרא עודכל החדשות והניתוחים שלנו בנושא Claude-Sonnet-4.5-Thinking — מתורגמים ומסוכמים ממקורות מובילים בעולם, עם הקשר עסקי ישראלי. 1 כתבות.
מחקר חדש ב-arXiv בודק מודלי LLM מתקדמים על הוכחות מתמטיות מספר אלגוריתמים רנדומליים. Gemini ו-Claude מובילים עם 66% דיוק. קראו עכשיו לפרטים מלאים.
קרא עוד