PRiSM: בנצ'מרק חדש לבדיקת חשיבה מדעית במודלי AI
האם VLMs מבינים פיזיקה אמיתית? PRiSM, בנצ'מרק חדש עם 24K+ בעיות, חושף כשלים בחשיבה מדעית באמצעות קוד פייתון. קראו עכשיו להבין את ההשלכות על AI עסקי. (112 מילים)
קרא עודמחקרים ופרסומים אקדמיים בתחום הבינה המלאכותית
האם VLMs מבינים פיזיקה אמיתית? PRiSM, בנצ'מרק חדש עם 24K+ בעיות, חושף כשלים בחשיבה מדעית באמצעות קוד פייתון. קראו עכשיו להבין את ההשלכות על AI עסקי. (112 מילים)
קרא עודSymPyBench הוא בנצ'מרק חדשני עם 15 אלף בעיות פיזיקה פרמטריות וקוד פייתון לבדיקה. בדקו את יכולות ההיגיון של מודלי AI שלכם. קראו עכשיו!
קרא עודחוקרים פיתחו צינור אוטומטי מבוסס LLMs ליצירת רשתות מותאמות אישית מתמלילי טיפולים, עם הערכה גבוהה ממומחים. קראו כיצד זה משפר התאמת טיפולים. קראו עכשיו!
קרא עודKANFormer – מודל למידה עמוקה חדש חוזה זמן מילוי פקודות לימיט במדויק יותר ממתחרים, באמצעות שילוב נתוני שוק וסוכנים. נבדק על CAC 40 ומצטיין במדדי כיול והפרדה. קראו על ההשלכות למסחר אוטומטי.
קרא עודמודלי ראייה-שפה נכשלים בתמונות מחופשות – ChromouVQA חושף את החולשות ומציע פתרון. בנצ'מרק חדש עם תשע משימות VQA מבוסס לוחות אישihara מורחב. קראו עכשיו על הפערים והשיפורים. (92 מילים)
קרא עודמודלי שפה וחזון נתקלים בקשיים בהיגיון מתמטי ומדעי אמין. TRACE, מסגרת חדשה, חושפת כשלים בצעדים הביניים באמצעות ARS ומדדי תואם. קראו כיצד זה משפר מודלים. (92 מילים)
קרא עודמחקר חדש בודק LLM על זיהוי אקסיומות באונטולוגיות באמצעות OntoAxiom. AbA עדיפה, ביצועים משתנים. קראו עכשיו להבין כיצד לשפר פיתוח ידע עסקי.
קרא עודAREA3D היא סוכן שחזור תלת-ממדי אקטיבי שמשלב AI מתקדם והנחיה סמנטית לבחירת נקודות תצפית אופטימליות. קראו על הפריצה במחקר חדש.
קרא עודבעידן ה-AI המהיר, קורס חדשני גורם לסטודנטים לגשר בין למידת מכונה מסורתית ל-LLM. שני חלקים רצופים, הוכח יעיל בקיץ. קראו על התוצאות והיישום. (92 מילים)
קרא עודסוכני AI קליניים נכשלים בשימוש במידע שמאחזרים. קיוראייג'נט, מסגרת חדשה, מפרידה בין ביצוע לניתוח ומשיגה תוצאות מובילות. קראו על הפריצה הזו עכשיו.
קרא עודMCP-AI מציגה ארכיטקטורה חדשה לבינה מלאכותית ברפואה שמאפשרת היגיון ממושך ושיתוף מאובטח. קראו על המקרי בדיקה והיתרונות הרגולטוריים.
קרא עוד