חדשות AI ואוטומציה

BAID: מדד חדש לבדיקת הטיות בגלאי טקסט AI

Dec 15, 2025

2 min

BAID: מדד חדש לבדיקת הטיות בגלאי טקסט AI

גלאי טקסט AI מפלים קבוצות מוחלשות – כך חושף מדד BAID החדש. המחקר ב-arXiv מציג 200 אלף דגימות לבדיקת הטיות. קראו כיצד זה משפיע על חינוך ועסקים. (92 מילים)

BAIDarXiv

מודלי AI מייצרים ידע מעשי להגנת גידולים אגרו-אקולוגית

מחקר

Dec 15, 2025

2 min

מודלי AI מייצרים ידע מעשי להגנת גידולים אגרו-אקולוגית

מחקר חדש מוכיח שמודלי AI כמו DeepSeek עולים על ChatGPT בייצור ידע על הדברת מזיקים, אך שניהם סובלים מהזיות. קראו כיצד זה משפיע על חקלאות מדויקת.

DeepSeekChatGPT

מסגרת חדשה לסוכני LLM אמינים במשימות רב-תוריות

מחקר

Dec 15, 2025

2 min

מסגרת חדשה לסוכני LLM אמינים במשימות רב-תוריות

מודלי שפה גדולים חזקים אך לא אמינים במשימות רב-תוריות. מסגרת חדשה ב-arXiv משלבת פרופיילר, חשיבה ויצירה מבוקרת להשגת אמינות. קראו על ההתפתחות המשותפת של הרכיבים.

LLMarXiv

CAPTURE: בנצ'מרק חדש לבדיקת LVLMs בפתרון CAPTCHA

מחקר

Dec 15, 2025

2 min

CAPTURE: בנצ'מרק חדש לבדיקת LVLMs בפתרון CAPTCHA

מודלים גדולים של שפה ויזואלית (LVLMs) נכשלים בפתרון CAPTCHA למרות יכולותיהם המתקדמות. CAPTURE – בנצ'מרק חדש ומקיף – חושף את החולשות הללו. קראו עכשיו על ההשלכות לעסקים. (112 מילים)

CAPTURELVLMsarXiv

AI-MASLD: כשל תפקודי במודלי שפה גדולים כמו מחלת כבד שומני

מחקר

Dec 15, 2025

3 min

AI-MASLD: כשל תפקודי במודלי שפה גדולים כמו מחלת כבד שומני

מחקר חדש חושף כשל תפקודי במודלי שפה גדולים בעיבוד תלונות חולים רועשות, ומציג את המונח AI-MASLD. Qwen3-Max מנצח, Gemini נכשל. אזהרה: AI רק כעזר אנושי. קראו עכשיו.

GPT-4oGemini 2.5DeepSeek 3.1

A-LAMP: LLM אג'נטי לאוטומציית MDP ולמידת חיזוק

מחקר

Dec 15, 2025

2 min

A-LAMP: LLM אג'נטי לאוטומציית MDP ולמידת חיזוק

A-LAMP משנה את כללי המשחק בלמידת חיזוק: תיאור טבעי הופך למדיניות מוכנה. קראו על הפריצה שמנצחת מודלים גדולים. קראו עכשיו! (112 מילים)

A-LAMParXiv:2512.11270

EmeraldMind: מסגרת AI חדשה לזיהוי גרינווashing

מחקר

Dec 15, 2025

3 min

EmeraldMind: מסגרת AI חדשה לזיהוי גרינווashing

חוקרים השיקו EmeraldMind, מסגרת AI שמזהה גרינווashing מדו"חות ESG בעזרת גרף ידע ייעודי. עולה על LLM גנריים בדיוק והסברים. קראו את המחקר המלא עכשיו.

EmeraldMindEmeraldGraph

FutureWeaver: תכנון חכם לחישוב בזמן מבחן במערכות רב-סוכנים

מחקר

Dec 15, 2025

3 min

FutureWeaver: תכנון חכם לחישוב בזמן מבחן במערכות רב-סוכנים

FutureWeaver מאפשרת שיפור ביצועי LLM במערכות רב-סוכנים על ידי תכנון חכם של חישוב זמן מבחן. קראו כיצד זה עובד ועדכנו את הפרויקטים שלכם. (42 מילים)

FutureWeaverarXiv:2512.11213v1

FIBER: בנצ'מרק חדש חושף הטיות עובדתיות ב-LLM

מחקר

Dec 15, 2025

2 min

FIBER: בנצ'מרק חדש חושף הטיות עובדתיות ב-LLM

מודלים לשונאיים גדולים סובלים מהטיות עובדתיות תלויות שפה, כך מראה בנצ'מרק FIBER החדש באנגלית, איטלקית וטורקית. קראו על הממצאים.

FIBERLlama-3.1-8BQwen-2.5-7B

בינה מלאכותית כמגבר קוגניטיבי: חשיבות השיפוט האנושי

דעה

Dec 15, 2025

3 min

בינה מלאכותית כמגבר קוגניטיבי: חשיבות השיפוט האנושי

בינה מלאכותית אינה מחליפה בני אדם, אלא מגבירה את יכולותיהם – בתנאי שהמשתמש מומחה. מאמר דעה חדש מציג מודל של שלוש רמות שימוש וממליץ על הכשרות משולבות. קראו כיצד ליישם זאת בעסק שלכם.

GPT-3arXiv

TriFlow: מסגרת רב-סוכנית חדשה לתכנון טיולים AI

מחקר

Dec 15, 2025

3 min

TriFlow: מסגרת רב-סוכנית חדשה לתכנון טיולים AI

TriFlow היא מסגרת AI רב-סוכנית חדשה לתכנון טיולים שמשיגה 97% הצלחה ביעילות גבוהה. קראו על השלבים והתוצאות המרשימות.

TriFlowTravelPlannerTripTailor

מוטיף-2-12.7B-Reasoning: מודל שפה פתוח להיגיון מורכב

מחקר

Dec 15, 2025

3 min

מוטיף-2-12.7B-Reasoning: מודל שפה פתוח להיגיון מורכב

Motif-2-12.7B-Reasoning סוגר את הפער למודלים פרונטיריים עם מתכון אימון חדשני להיגיון מורכב והקשר ארוך. קראו על התוצאות המרשימות ועל ההשלכות לעסקים ישראליים.

Motif-2-12.7B-Reasoning

AgentBalance: עיצוב חסכוני למערכות רב-סוכנים תחת אילוצי תקציב

מחקר

Dec 15, 2025

3 min

AgentBalance: עיצוב חסכוני למערכות רב-סוכנים תחת אילוצי תקציב

מערכות רב-סוכנים מבוססות LLM חיוניות לאפליקציות גדולות, אך חיסכון בעלויות הוא המפתח. AgentBalance מציגה גישה חדשה: קודם מודלים בסיסיים, אחר כך טופולוגיה, עם שיפורים של 10%-22%. קראו את המאמר המלא כדי להבין איך ליישם זאת בעסק שלכם. (98 מילים)

AgentBalanceusail-hkustLLM

גרוק של אלון מאסק טעה קשות בפרטי ירי בונדי ביץ'

חדשות

Dec 15, 2025

2 min

גרוק של אלון מאסק טעה קשות בפרטי ירי בונדי ביץ'

גרוק, צ'אטבוט ה-AI של אלון מאסק, פיזר מידע שגוי על ירי המוני בחוף בונדי, זיהה בטעות את הגיבור שחיסל רוצח. קראו על הסיכונים לעסקים. קראו עכשיו המלא.

GrokxAIElon Musk

בנייה מול קנייה מתה: AI שינתה את חוקי המשחק

דעה

Dec 15, 2025

4 min

בנייה מול קנייה מתה: AI שינתה את חוקי המשחק

דמיינו עובד כספים בונה אבטיפוס בשעתיים עם AI ומבטל עסקת ספק. AI הורג את 'בנייה מול קנייה' – כעת בונים כדי להבין צרכים וקונים חכם. קראו כיצד זה משנה החלטות עסקיות.

RunwaySiqi ChenCursor

בום מרכזי הנתונים AI מאיים על תשתיות אחרות

חדשות

Dec 14, 2025

3 min

בום מרכזי הנתונים AI מאיים על תשתיות אחרות

בום מרכזי הנתונים AI גורם לתחרות חריפה על עובדים ומשאבים, ומאיים להאט פרויקטי תשתית קריטיים. נתונים חדשים חושפים הוצאות פרטיות של 41 מיליארד דולר בשנה. קראו את הניתוח המלא.

AutodeskAndrew AnagnostBloomberg

בפעם הראשונה: AI מנתח שפה ברמה של מומחה אנושי

מחקר

Dec 14, 2025

4 min

בפעם הראשונה: AI מנתח שפה ברמה של מומחה אנושי

בפעם הראשונה, מודל AI כמו o1 של OpenAI מנתח שפה ברמה של מומחה אנושי, כולל רצורסיה וחוסר ודאות. קראו את המחקר המפתיע שמאתגר את צ'ומסקי. (48 מילים – הרחבה ל-120)

OpenAIo1Gašper Beguš

גוגל מארחת אידיאתון מדע נתונים לבריאות בכל אפריקה

חדשות

Dec 14, 2025

4 min

גוגל מארחת אידיאתון מדע נתונים לבריאות בכל אפריקה

גוגל אירחה אידיאתון מדע נתונים לבריאות באפריקה, שבו חוקרים השתמשו במודלי AI פתוחים לפתרון אתגרי סרטן צוואר הרחם ובריאות אם. קראו על הזוכים והפוטנציאל העצום.

Google ResearchGoogle DeepMindMedGemma

חדשות AI - עמוד 140

BAID: מדד חדש לבדיקת הטיות בגלאי טקסט AI

מודלי AI מייצרים ידע מעשי להגנת גידולים אגרו-אקולוגית

מסגרת חדשה לסוכני LLM אמינים במשימות רב-תוריות

CAPTURE: בנצ'מרק חדש לבדיקת LVLMs בפתרון CAPTCHA

AI-MASLD: כשל תפקודי במודלי שפה גדולים כמו מחלת כבד שומני

A-LAMP: LLM אג'נטי לאוטומציית MDP ולמידת חיזוק

EmeraldMind: מסגרת AI חדשה לזיהוי גרינווashing

FutureWeaver: תכנון חכם לחישוב בזמן מבחן במערכות רב-סוכנים

FIBER: בנצ'מרק חדש חושף הטיות עובדתיות ב-LLM

בינה מלאכותית כמגבר קוגניטיבי: חשיבות השיפוט האנושי

TriFlow: מסגרת רב-סוכנית חדשה לתכנון טיולים AI

מוטיף-2-12.7B-Reasoning: מודל שפה פתוח להיגיון מורכב

AgentBalance: עיצוב חסכוני למערכות רב-סוכנים תחת אילוצי תקציב

גרוק של אלון מאסק טעה קשות בפרטי ירי בונדי ביץ'

בנייה מול קנייה מתה: AI שינתה את חוקי המשחק

בום מרכזי הנתונים AI מאיים על תשתיות אחרות

בפעם הראשונה: AI מנתח שפה ברמה של מומחה אנושי

גוגל מארחת אידיאתון מדע נתונים לבריאות בכל אפריקה