RubricHub: מאגר רובריקות AI שמשבור שיאי ביצועים

14 בינואר 2026

3 דקות

מ־arXiv cs.AI

RubricHub: מאגר רובריקות AI שמשבור שיאי ביצועים

חוקרים משיקים RubricHub – מאגר רובריקות AI מתקדם שמשפר ביצועי מודלים ב-RLVR ומשיג SOTA על HealthBench. קראו עכשיו!

RubricHub RLVR Qwen3-14B

קרא עוד

מודל QOR: היגיון איכותני על סיבובי עצמים פותר CCT

מחקר

14 בינואר 2026

3 דקות

מ־arXiv cs.AI

מודל QOR: היגיון איכותני על סיבובי עצמים פותר CCT

בעידן שבו בינה מלאכותית צריכה להתמודד עם משימות מורכבות של היגיון מרחבי, מאמר חדש ב-arXiv מציג את מודל QOR... קראו את המאמר המלא עכשיו כדי להבין את ההשלכות!

QOR CCT Ekstrom et al.

קרא עוד

ToolACE-MCP: ניתוב חכם לסוכני AI בעולם הפתוח

מחקר

14 בינואר 2026

2 דקות

מ־arXiv cs.AI

ToolACE-MCP: ניתוב חכם לסוכני AI בעולם הפתוח

בעידן רשת הסוכנים, ToolACE-MCP מציג פיילין לניתוב מדויק בכלים רבים. הניסויים מראים ביצועים עליונים ועמידות גבוהה. קראו עכשיו על הפריצה הזו!

ToolACE-MCP Agent Web MCP

קרא עוד

סאמפיילוט: סיכום אינטראקטיבי מותאם אישית

מחקר

14 בינואר 2026

2 דקות

מ־arXiv cs.AI

סאמפיילוט: סיכום אינטראקטיבי מותאם אישית

בעידן של הצפת מידע, סאמפיילוט מציעה סיכום אינטראקטיבי מותאם אישית מבוסס LLM. קראו עכשיו על הכלים החדשניים שמשנים את עיבוד המסמכים.

SummPilot

קרא עוד

הזקקת ידע היברידית: קוד שליטה קל לרחפנים עם CoT

מחקר

14 בינואר 2026

3 דקות

מ־arXiv cs.AI

הזקקת ידע היברידית: קוד שליטה קל לרחפנים עם CoT

בעידן שבו רחפנים הופכים לכלי חיוני בתעשיות שונות, אתגר מרכזי הוא שילוב יכולות יצירת קוד של מודלי שפה גדולים במערכות בעלות משאבים מוגבלים. מחקר חדש מציג פתרון חדשני. קראו עכשיו על ההזקקה ההיברידית עם CoT.

DeepSeek-Coder-V2-Lite UAV

קרא עוד

מדללות הכרחית: יציבות מהירה ל-LLM סוכניים במרחבי פעולה גדולים

מחקר

14 בינואר 2026

2 דקות

מ־arXiv cs.AI

מדללות הכרחית: יציבות מהירה ל-LLM סוכניים במרחבי פעולה גדולים

בעידן סוכני LLM עם מרחבי פעולות עצומים, מדללות היא המפתח ליציבות. מחקר חדש מציג SAC ומביא תוצאות תיאורטיות חדות. קראו עכשיו כדי להבין את ההשלכות העסקיות.

SAC

קרא עוד

שטיפת סמנטיקה בסוכני AI: בעיה ארכיטקטונית קריטית

מחקר

14 בינואר 2026

2 דקות

מ־arXiv cs.AI

שטיפת סמנטיקה בסוכני AI: בעיה ארכיטקטונית קריטית

בעידן שבו סוכני AI מבוססי LLM משתלטים, מחקר חדש חושף שטיפת סמנטיקה – כשל שמאפשר מידע חסר הצדקה להפוך ל'אמין'. קראו עכשיו על משפט הרישוי העצמי הבלתי נמנע.

arXiv:2601.08333

קרא עוד

מודל AI גדול מנחה DRL: שיפור 64% ברשתות NTN

מחקר

14 בינואר 2026

2 דקות

מ־arXiv cs.AI

מודל AI גדול מנחה DRL: שיפור 64% ברשתות NTN

מודל AI גדול מנחה DRL להקצאת משאבים ב-NTN: שיפור של 64% בתנאי מזג אוויר קיצוניים. קראו על המחקר החדש שמשנה את כללי המשחק בתקשורת לוויינית. קראו עכשיו! (48 מילים)

arXiv:2601.08254 LAM DRL

קרא עוד

EvoEnv: בנצ'מרק חדש לבדיקת סוכני AI בעבודה

מחקר

14 בינואר 2026

2 דקות

מ־arXiv cs.AI

EvoEnv: בנצ'מרק חדש לבדיקת סוכני AI בעבודה

מחקר חדש מציג EvoEnv – סביבת בדיקה דינמית לסוכני AI שחושפת חולשות באוטומציה אמיתית. קראו עכשיו!

EvoEnv KnowledgeXLab

קרא עוד

MemoBrain: זיכרון מנהלים לחשיבה ארוכת טווח ב-AI

מחקר

14 בינואר 2026

2 דקות

מ־arXiv cs.AI

MemoBrain: זיכרון מנהלים לחשיבה ארוכת טווח ב-AI

בעידן שבו סוכני AI מבצעים משימות מורכבות הדורשות חשיבה ארוכת טווח, הבעיה המרכזית היא הצטברות של עקבות חשיבה ותוצרי כלים זמניים שמציפים את זיכרון העבודה המוגבל של מודלי שפה גדולים. MemoBrain פותר זאת. קראו עכשיו על המודל החדשני.

MemoBrain GAIA WebWalker

קרא עוד

CADA: יישור דיברטיבי מועשר במקרים לבטיחות LLM

מחקר

14 בינואר 2026

2 דקות

מ־arXiv cs.AI

CADA: יישור דיברטיבי מועשר במקרים לבטיחות LLM

בעידן שבו מודלי שפה גדולים משתלטים על עולם הבינה המלאכותית, אתגר מרכזי נותר: כיצד להבטיח בטיחות מבלי לסרב לבקשות תמימות? מחקר חדש מציג CADA, שיטה מועשרת במקרים. קראו עכשיו על היתרונות.

OpenAI CADA

קרא עוד

תאוותני מספיק: גילוי פעולות מדוללות באג'נטים של LLMs

מחקר

14 בינואר 2026

2 דקות

מ־arXiv cs.AI

תאוותני מספיק: גילוי פעולות מדוללות באג'נטים של LLMs

בעידן שבו מערכות AI אג'נטיות פועלות במרחבים עם אלפי פעולות אפשריות – כמו קריאות API או חיפושים – מתברר שרק תת-קבוצה קטנה משפיעה באמת על הביצועים. מחקר חדש מ-arXiv חושף גישה חדשנית... קראו עכשיו את הניתוח המלא!

Orthogonal Matching Pursuit

קרא עוד

סוף הנדסת התגמולים: LLMs משנים תיאום רב-סוכני

מחקר

14 בינואר 2026

2 דקות

מ־arXiv cs.AI

סוף הנדסת התגמולים: LLMs משנים תיאום רב-סוכני

בעידן שבו חברות עסקיות משקיעות מיליונים בפיתוח סוכני AI רב-סוכניים, הנדסת התגמולים נותרת אתגר מרכזי... קראו את המאמר המלא כדי להבין כיצד LLMs משנים את חוקי המשחק.

EUREKA CARD RLVR

קרא עוד

ZeroDVFS: תזמון ליבות ותדרים חכם למערכות משובצות

מחקר

14 בינואר 2026

2 דקות

מ־arXiv cs.AI

ZeroDVFS: תזמון ליבות ותדרים חכם למערכות משובצות

בעולם המערכות המשובצות, ZeroDVFS מציג תזמון חכם מבוסס MARL ו-LLM שמשפר יעילות אנרגטית פי 7 ומקצר זמנים פי 4. קראו את הפרטים המלאים עכשיו.

ZeroDVFS NVIDIA Jetson TX2 Jetson Orin NX

קרא עוד

מחקר

14 בינואר 2026

2 דקות

מ־arXiv cs.AI

למה הוראות 'אל תשתמש' נכשלות במודלי AI?

הוראות שליליות כמו 'אל תשתמש ב-X' נכשלות במודלי AI בגלל לחץ סמנטי ומנגנוני כשל ספציפיים. קראו את הניתוח המלא עכשיו.

קרא עוד

מחקר

14 בינואר 2026

3 דקות

מ־arXiv cs.AI

מודלי AI יודעים מתי לא לדעת: כיול וקסקד

בעידן שבו מודלי בינה מלאכותית מקבלים החלטות עסקיות קריטיות, היכולת שלהם לזהות מתי הם לא יודעים היא מפתח לאמינות. מחקר חדש מציג שיטה פשוטה ללא אימון: כיול, קסקד וניקוי. קראו עכשיו על ההשלכות העסקיות.

ImageNet MMLU

קרא עוד

MPCI-Bench: בנצ'מרק חדש לבדיקת פרטיות AI רב-מודלית

מחקר

14 בינואר 2026

2 דקות

מ־arXiv cs.AI

MPCI-Bench: בנצ'מרק חדש לבדיקת פרטיות AI רב-מודלית

סוכני AI מתקדמים מטפלים בנתונים אישיים – האם הם מכבדים פרטיות? MPCI-Bench, בנצ'מרק רב-מודלי חדש, בודק זאת. קראו עכשיו על הכשלים שגילו. (45 מילים – הרחב ל-100)

MPCI-Bench Contextual Integrity

קרא עוד