מחקר
2 דקות
מ־arXiv cs.AI
בדיקת חשיבה מתמטית של LLMs בבעיות תחרותיות נדירות
מחקר חדש בודק LLMs על בעיות מתמטיקה תחרותיות נדירות: DeepSeek-V3 מנצח, אבל כולם חלשים בגיאומטריה. קראו עכשיו על דפוסי השגיאות.
קרא עודכל החדשות והניתוחים שלנו בנושא Gemini-2.0-Flash — מתורגמים ומסוכמים ממקורות מובילים בעולם, עם הקשר עסקי ישראלי. 1 כתבות.
מחקר חדש בודק LLMs על בעיות מתמטיקה תחרותיות נדירות: DeepSeek-V3 מנצח, אבל כולם חלשים בגיאומטריה. קראו עכשיו על דפוסי השגיאות.
קרא עוד