KidsArtBench: הערכת אמנות ילדים רב-ממדית עם MLLMs

16 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

KidsArtBench: הערכת אמנות ילדים רב-ממדית עם MLLMs

חוקרים השיקו KidsArtBench, מבחן חדש להערכת אמנות ילדים עם AI רב-מודלי. שיפור משמעותי בדיוק – קראו עכשיו!

KidsArtBench Qwen2.5-VL-7B MLLMs

קרא עוד

מערכות רב-סוכנים מודעות לערכים: מפת דרכים חדשה ל-AI

מחקר

16 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

מערכות רב-סוכנים מודעות לערכים: מפת דרכים חדשה ל-AI

מאמר חדש ב-arXiv מציג 'מודעות לערכים' ב-AI: מפת דרכים עם שלושה עמודי תווך ללמידת ערכים, התאמה והסבריות. קראו כיצד זה משפיע על מערכות רב-סוכנים. קראו עכשיו!

Value-Aware Multiagent Systems

קרא עוד

SafeGen: מסגרת אתית חדשה ליצירת תמונות AI

מחקר

16 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

SafeGen: מסגרת אתית חדשה ליצירת תמונות AI

בינה מלאכותית גנרטיבית פותחת אפשרויות אדירות, אך מעלה סיכונים אתיים. SafeGen מציעה מסגרת בטוחה עם סינון פרומפטים ותמונות איכותיות. קראו על המדדים המרשימים ועל ההשלכות העסקיות.

SafeGen BGE-M3 Hyper-SD

קרא עוד

MobiBench: בנצ'מרק מודולרי חדשני לסוכני GUI במובייל

מחקר

16 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

MobiBench: בנצ'מרק מודולרי חדשני לסוכני GUI במובייל

סוכני GUI במובייל מבטיחים מהפכה, אך בדיקתם בעייתית. MobiBench פותרת זאת עם בנצ'מרק offline מודולרי שמשיג 94.72% הסכמה אנושית. קראו על התובנות החדשות.

MobiBench Mobile GUI Agents LFMs

קרא עוד

MetaHGNIE: היפרגרף ניגודי לגרפים ידע הטרוגניים

מחקר

16 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

MetaHGNIE: היפרגרף ניגודי לגרפים ידע הטרוגניים

MetaHGNIE מציגה פריצת דרך בהערכת חשיבות צמתים בגרפים ידע הטרוגניים באמצעות היפרגרף ניגודי. קראו על השיפורים במבנה וסמנטיקה.

MetaHGNIE SEU-WENJIA

קרא עוד

אטלס שקיפות AI: מסגרת חדשה להערכת מסמכי מודלים

מחקר

16 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

אטלס שקיפות AI: מסגרת חדשה להערכת מסמכי מודלים

תיעוד מודלי AI מפוזר ולא עקבי, חושף מחקר חדש. מסגרת הערכה אוטומטית חושפת פערים בבטיחות בקרב מודלים מובילים. קראו את הפרטים המלאים.

Gemini 3 Grok 4.1 Llama 4

קרא עוד

חשים את העוצמה אך לא את המקור: אינטרוספקציה חלקית במודלי שפה

מחקר

16 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

חשים את העוצמה אך לא את המקור: אינטרוספקציה חלקית במודלי שפה

מחקר חדש ב-arXiv חושף: מודלי שפה כמו Llama-3.1 מזהים מושגים מוזרקים ב-20% הצלחה, אך היכולת שבירה. הם מצטיינים בסיווג עוצמה (70%). קראו על אינטרוספקציה חלקית במודלים.

Anthropic Meta-Llama-3.1-8B-Instruct arXiv:2512.12411v1

קרא עוד

תיאוריה גיאומטרית חדשה מאחדת את קוגניציית האדם

מחקר

16 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

תיאוריה גיאומטרית חדשה מאחדת את קוגניציית האדם

בעידן שבו בינה מלאכותית שואפת לחקות את המוח האנושי, חוקרים מציגים תיאוריה גיאומטרית פורצת דרך שמאחדת מגוון תהליכי קוגניציה בעיקרון אחד. קראו את הפרטים המלאים על המסגרת שתשנה את פיתוח ה-AI.

arXiv:2512.12225v1 Geometric Theory of Cognition

קרא עוד

סקלת חשיבה ביקורתית בשימוש ב-AI: פיתוח ומאומת

מחקר

16 בדצמבר 2025

3 דקות

מ־arXiv cs.AI

סקלת חשיבה ביקורתית בשימוש ב-AI: פיתוח ומאומת

כלי AI גנרטיבי שולטים בעבודה, אך חשיבה ביקורתית חיונית. מחקר חדש מציג סקלה מאומתת ל-13 פריטים שמודדת אימות, מוטיבציה ורפלקציה. קראו כיצד זה משפר דיוק ומפחית סיכונים.

ChatGPT

קרא עוד

פלורפלן2גייד: LLM מנתח תוכניות קומה לניווט עיוורים

מחקר

16 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

פלורפלן2גייד: LLM מנתח תוכניות קומה לניווט עיוורים

ניווט פנים-מבני לעיוורים הופך נגיש יותר בעזרת Floorplan2Guide, שמעביר תוכניות קומה לגרפות ידע באמצעות LLM ומשיג דיוק גבוה עד 92%. קראו על התוצאות המעולות של Claude 3.7 Sonnet. (48 מילים)

Floorplan2Guide Claude 3.7 Sonnet arXiv:2512.12177

קרא עוד

עקביות תוויות בלמידה בהקשר: גישה חדשה להפצת תוויות טרנסדוקטיבית

מחקר

16 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

עקביות תוויות בלמידה בהקשר: גישה חדשה להפצת תוויות טרנסדוקטיבית

מודלי שפה גדולים משתפרים בעקביות תוויות בלמידה בהקשר באמצעות TopK-SD, שיטה חדשה שמשלבת סינתזה נתונים. קראו על הנקודת מבט הטרנסדוקטיבית שמשנה את חוקי המשחק. עכשיו בלעדי באוטומציות AI.

Large Language Models In-Context Learning TopK-SD

קרא עוד

Forecast Critic: LLM לזיהוי תחזיות כושלות בקמעונאות

מחקר

16 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

Forecast Critic: LLM לזיהוי תחזיות כושלות בקמעונאות

Forecast Critic משתמש ב-LLM לניטור תחזיות בקמעונאות ומזהה שגיאות קשות. ציון F1 גבוה וביצועים קרובים לאדם. קראו על הפוטנציאל העסקי.

Forecast Critic M5 dataset

קרא עוד

CAMAC-DRA: תיאום סוכנים חכם לטעינת רכב חשמלי

מחקר

16 בדצמבר 2025

3 דקות

מ־arXiv cs.AI

CAMAC-DRA: תיאום סוכנים חכם לטעינת רכב חשמלי

CAMAC-DRA היא מסגרת חדשה שמתאמת סוכני טעינה חכמים ב-250 רכבים ו-45 תחנות, ומשפרת יעילות ב-15% ומפחיתה עלויות ב-10%. קראו עכשיו על הפריצת דרך הזו. (112 מילים)

CAMAC-DRA Smart2Charge Deep Q-Networks

קרא עוד

EnrichLog: זיהוי תקלות בלוגים ללא אימון עם LLM

מחקר

16 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

EnrichLog: זיהוי תקלות בלוגים ללא אימון עם LLM

לוגים הם המפתח לניטור מערכות, אך שיטות מסורתיות נכשלות. EnrichLog, מסגרת חדשה ללא אימון, משפרת זיהוי חריגות בעזרת LLM ו-RAG. קראו על התוצאות המרשימות.

EnrichLog arXiv:2512.11997

קרא עוד

תורת ההיפרגיים: פתרון להתנגשויות תפיסה בסוכנים AI

מחקר

16 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

תורת ההיפרגיים: פתרון להתנגשויות תפיסה בסוכנים AI

מחקר חדש בתורת ההיפרגיים מציג שפה לוגית ואלגוריתמים לפתרון התנגשויות תפיסה בסוכנים AI אסטרטגיים. זה משנה את כללי המשחק במערכות רב-סוכנים. קראו עכשיו! (48 מילים)

hypergame theory answer-set programming multi-agent systems

קרא עוד

היגיון סיבתי במודלי שפה: השוואה חדשה לבני אדם

מחקר

16 בדצמבר 2025

3 דקות

מ־arXiv cs.AI

היגיון סיבתי במודלי שפה: השוואה חדשה לבני אדם

מחקר חדש משווה היגיון סיבתי ב-LLMs לבני אדם באמצעות משימות זהות ומודלים בייסיאניים. קראו על השיטה שחושפת חוזקות וחולשות. קראו עכשיו!

Causal Bayes Nets Noisy-OR

קרא עוד

CXL-SpecKV: פתרון חדשני לבעיית זיכרון במודלי LLM

מחקר

16 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

CXL-SpecKV: פתרון חדשני לבעיית זיכרון במודלי LLM

מודלי שפה גדולים סובלים מבעיות זיכרון כבדות במרכזי נתונים. CXL-SpecKV, ארכיטקטורה חדשה מבוססת CXL ו-FPGA, משפרת תפוקה פי 3.2 ומפחיתה עלויות. קראו על החידושים.

CXL-SpecKV CXL FPGA

קרא עוד

ארכיטקטורת מונדות חדשה לניהול זיכרון בדגמי שפה גדולים

מחקר

16 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

ארכיטקטורת מונדות חדשה לניהול זיכרון בדגמי שפה גדולים

דגמי שפה גדולים זקוקים לפיקוח על זיכרונם. חוקרים מציגים ארכיטקטורה מבוססת מונדות של לייבניץ על ציון AAS, עם ניסויים ב-Python שמבטיחים התנהגות מבוקרת. קראו כיצד זה משנה עיצוב AI.

AAS Leibniz

קרא עוד

חדשות מחקר

מחקר - עמוד 70

KidsArtBench: הערכת אמנות ילדים רב-ממדית עם MLLMs

מערכות רב-סוכנים מודעות לערכים: מפת דרכים חדשה ל-AI

SafeGen: מסגרת אתית חדשה ליצירת תמונות AI

MobiBench: בנצ'מרק מודולרי חדשני לסוכני GUI במובייל

MetaHGNIE: היפרגרף ניגודי לגרפים ידע הטרוגניים

אטלס שקיפות AI: מסגרת חדשה להערכת מסמכי מודלים

חשים את העוצמה אך לא את המקור: אינטרוספקציה חלקית במודלי שפה

תיאוריה גיאומטרית חדשה מאחדת את קוגניציית האדם

סקלת חשיבה ביקורתית בשימוש ב-AI: פיתוח ומאומת

פלורפלן2גייד: LLM מנתח תוכניות קומה לניווט עיוורים

עקביות תוויות בלמידה בהקשר: גישה חדשה להפצת תוויות טרנסדוקטיבית

Forecast Critic: LLM לזיהוי תחזיות כושלות בקמעונאות

CAMAC-DRA: תיאום סוכנים חכם לטעינת רכב חשמלי

EnrichLog: זיהוי תקלות בלוגים ללא אימון עם LLM

תורת ההיפרגיים: פתרון להתנגשויות תפיסה בסוכנים AI

היגיון סיבתי במודלי שפה: השוואה חדשה לבני אדם

CXL-SpecKV: פתרון חדשני לבעיית זיכרון במודלי LLM

ארכיטקטורת מונדות חדשה לניהול זיכרון בדגמי שפה גדולים