9 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

ICC חושף חוסר עקביות בהערכת סוכני AI

מודלי שפה גדולים במערכות סוכניות זקוקים להערכה אמינה. ICC חושף חוסר עקביות ומבדיל שיפורים אמיתיים. קראו על התוצאות ב-GAIA ו-FRAMES.

GAIA FRAMES Intraclass Correlation Coefficient

קרא עוד

מדיניות AI בכתבי עת נכשלת: שימוש בכלים גואה

מחקר

9 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

מדיניות AI בכתבי עת נכשלת: שימוש בכלים גואה

מדיניות AI בכתבי עת נכשלה: שימוש זינק למרות 70% כללים. רק 0.1% מגלים שימוש. קראו את המחקר המלא.

generative AI academic journals

קרא עוד

LightSearcher: חיפוש עמוק יעיל בזכות זיכרון חווייתי

מחקר

9 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

LightSearcher: חיפוש עמוק יעיל בזכות זיכרון חווייתי

מודל LightSearcher החדש משפר יעילות חיפוש עמוק ב-AI ב-40% מבלי לפגוע בדיוק. קראו על הזיכרון החווייתי שמשנה את כללי המשחק. קראו עכשיו.

LightSearcher ReSearch

קרא עוד

תיבות אמונות בסוכני AI: כיצד הן משפיעות על שכנוע

מחקר

9 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

תיבות אמונות בסוכני AI: כיצד הן משפיעות על שכנוע

מחקר חדש חושף כיצד תיבות אמונות בפרומפטים של סוכני LLM משנות התנהגות, מגבירות עמידות ומשפרות שכנוע בתרחישי דיון. קראו עכשיו! (48 מילים)

multi-agent systems

קרא עוד

UncertaintyZoo: כלי חדש להערכת אי ודאות במודלי שפה גדולים

מחקר

9 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

UncertaintyZoo: כלי חדש להערכת אי ודאות במודלי שפה גדולים

מודלי שפה גדולים עלולים לטעות בסביבות קריטיות. UncertaintyZoo – כלי חדש שמאחד 29 שיטות להערכת אי ודאות, נבדק בהצלחה על זיהוי פגיעויות בקוד. קראו עכשיו על הפוטנציאל לעסקים ישראלים.

UncertaintyZoo CodeBERT ChatGLM3

קרא עוד

GENIUS: מסגרת AI אוטונומית לסימולציות חומרים

מחקר

9 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

GENIUS: מסגרת AI אוטונומית לסימולציות חומרים

GENIUS, מסגרת AI חדשה, מאפשרת סימולציות חומרים אוטונומיות עם 80% הצלחה. קראו כיצד היא משנה את ICME לקראת עידן הנגישות. קראו עכשיו המלצות ליישום.

GENIUS Quantum ESPRESSO ICME

קרא עוד

DaGRPO: שיטה חדשה משפרת חשיבה ארוכת טווח במודלי שפה

מחקר

9 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

DaGRPO: שיטה חדשה משפרת חשיבה ארוכת טווח במודלי שפה

מודלי שפה גדולים מתקשים בחשיבה ארוכת טווח? DaGRPO פותרת בעיות יציבות ב-GRPO עם תיקון גרדיאנט והגברת נתונים, ומשיגה שיאים במבחנים. קראו על הפריצה החדשה.

DaGRPO GRPO

קרא עוד

מדידת העיגון הסמלי: מסגרת חדשה לבדיקת משמעות ב-AI

מחקר

9 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

מדידת העיגון הסמלי: מסגרת חדשה לבדיקת משמעות ב-AI

מאמר חדש ב-arXiv מציג מסגרת מדידה לבעיית העיגון הסמלי ב-AI, עם בדיקה של LLMs ושפה אנושית. קראו כיצד לבחון אם מודלים באמת מבינים את העולם. עכשיו באוטומציות AI.

symbol grounding problem model-theoretic semantics

קרא עוד

ARCANE: מסגרת רב-סוכנית להתאמה פרשנית וגמישה ב-AI

מחקר

9 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

ARCANE: מסגרת רב-סוכנית להתאמה פרשנית וגמישה ב-AI

סוכני AI ארוכי טווח זקוקים להתאמה פרשנית. ARCANE מציגה רובריקות שפה טבעית דינמיות להיגוי בזמן אמת. קראו על התוצאות המבטיחות ממשימות מורכבות. (48 מילים, אבל הרחב ל-100)

ARCANE GSPO GDPVal

קרא עוד

מודל שקוף לאבחון אוטיזם: 97% דיוק בטקסטים קליניים

מחקר

9 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

מודל שקוף לאבחון אוטיזם: 97% דיוק בטקסטים קליניים

האוטיזם הופך נפוץ, אבחונו ארוך. מודל BioBERT שקוף מנתח טקסטים קליניים ומגיע ל-97% דיוק. קראו על היתרונות על פני מודלים שחורים. (112 מילים)

BioBERT ASD

קרא עוד

הימורים וירטואליים משפרים ביטחון במודלי שפה גדולים

מחקר

9 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

הימורים וירטואליים משפרים ביטחון במודלי שפה גדולים

מחקר חדש מראה שמשחק הימורים וירטואלי משפר את דיוק הביטחון בהערכות של מודלי שפה גדולים. הימורים גדולים צדקו ב-99%. קראו כיצד זה עובד.

Prediction Markets

קרא עוד

דיוק BERT לשאלות ותשובות אקדמיות: צעד ראשון למערכות חכמות באוניברסיטאות

מחקר

8 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

דיוק BERT לשאלות ותשובות אקדמיות: צעד ראשון למערכות חכמות באוניברסיטאות

חוקרים מאוניברסיטת לימריק שיפרו BERT לצ'אטבוט מידע קורסים עם 1,203 זוגות QA. התוצאות מראות שיפור בדיוק, צעד ראשון למודלים אקדמיים. קראו על הפוטנציאל לחינוך דיגיטלי. (112 מילים)

BERT University of Limerick SQuAD

קרא עוד

מחקר

8 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

למידת תכנות עם הקשר: גישה מבוססת מחקר חדש

כלי AI גנרטיביים משנים את פיתוח התוכנה, ומחקר חדש בודק כיצד סטודנטים משתמשים בהם בקורס פיתוח משחקים. גלו את היתרונות, האתגרים ועוזר LLM מבוסס RAG. קראו עכשיו להבין איך להסתגל.

arXiv:2512.05242 Retrieval-Augmented Generation (RAG)large language model (LLM)

קרא עוד

בנצ'מרק CIVIQ: התאמה תרבותית למודלי שפה גדולים בארה"ב

מחקר

8 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

בנצ'מרק CIVIQ: התאמה תרבותית למודלי שפה גדולים בארה"ב

מודלי שפה גדולים מוטים תרבותית – מחקר מציע בנצ'מרק CIVIQ להתאמה לקהילות בארה"ב. קראו על הפתרון החדשני.

CIVIQ KorNAT ChatBlackGPT

קרא עוד

אימון משותף לבלתי תלות: מהפכה בהכללה ויזואלית של רובוטים

מחקר

8 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

אימון משותף לבלתי תלות: מהפכה בהכללה ויזואלית של רובוטים

רובוטים מתקשים להתמודד עם שינויי תאורה ונקודת מבט? מחקר חדש מציג אימון משותף לבלתי תלות שמשפר הכללה ב-18%. קראו כיצד לשלב נתונים סינתטיים להצלחה עסקית. קראו עכשיו! (48 מילים)

Unreal Engine Invariance Co-training

קרא עוד

איך לכבש את ה-LLM: התמוטטות סמנטית במערכות רציפות

מחקר

8 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

איך לכבש את ה-LLM: התמוטטות סמנטית במערכות רציפות

בעידן שבו מודלי שפה גדולים שולטים, תיאוריה חדשה ב-arXiv מסבירה התמוטטות סמנטית: כיצד חישוב רציף הופך למשמעות דיסקרטית. קראו על מכונות מצב רציפות וטענת SCT. קראו עכשיו! (112 מילים)

CSM SCT

קרא עוד