מחקר
2 דקות
מ־arXiv cs.AI
בנצ'מרק חדש: Gemini ו-Claude מצטיינים בהוכחות מתמטיות ברמת דוקטורט
מחקר חדש ב-arXiv בודק מודלי LLM מתקדמים על הוכחות מתמטיות מספר אלגוריתמים רנדומליים. Gemini ו-Claude מובילים עם 66% דיוק. קראו עכשיו לפרטים מלאים.
קרא עודכל החדשות והניתוחים שלנו בנושא Grok-4 — מתורגמים ומסוכמים ממקורות מובילים בעולם, עם הקשר עסקי ישראלי. 2 כתבות.
מחקר חדש ב-arXiv בודק מודלי LLM מתקדמים על הוכחות מתמטיות מספר אלגוריתמים רנדומליים. Gemini ו-Claude מובילים עם 66% דיוק. קראו עכשיו לפרטים מלאים.
קרא עודחוקרים מציגים אמבדינגים ממקדות אוטואנקודר קרסות (SAEs) – שיטה חסכונית ומדויקת לניתוח קורפוסי טקסט גדולים, טובה יותר מ-LLMs. קראו עכשיו!
קרא עוד