מחקר
2 דקות
מ־arXiv cs.AI
PRiSM: בנצ'מרק חדש לבדיקת חשיבה מדעית במודלי AI
האם VLMs מבינים פיזיקה אמיתית? PRiSM, בנצ'מרק חדש עם 24K+ בעיות, חושף כשלים בחשיבה מדעית באמצעות קוד פייתון. קראו עכשיו להבין את ההשלכות על AI עסקי. (112 מילים)
קרא עודכל החדשות והניתוחים שלנו בנושא PRiSM — מתורגמים ומסוכמים ממקורות מובילים בעולם, עם הקשר עסקי ישראלי. 1 כתבות.
האם VLMs מבינים פיזיקה אמיתית? PRiSM, בנצ'מרק חדש עם 24K+ בעיות, חושף כשלים בחשיבה מדעית באמצעות קוד פייתון. קראו עכשיו להבין את ההשלכות על AI עסקי. (112 מילים)
קרא עוד