חוסר יכולת נלמד: כיצד LLM מסרבים בנושאים רגישים
מודלי שפה גדולים מיושרים RLHF מציגים חוסר יכולת נלמד (LI): ביצועים רגילים בנושאים ניטרליים אך סירוב תפקודי ברגישים. מחקר חדש חושף את התופעה בדיאלוג ארוך ומציע מסגרת ביקורת. קראו את הניתוח המלא.
קרא עודהמקור המוביל בישראל לעדכונים טכנולוגיים, ניתוחי עומק על בינה מלאכותית, ומדריכים לייעול העסק בעזרת אוטומציה.
מודלי שפה גדולים מיושרים RLHF מציגים חוסר יכולת נלמד (LI): ביצועים רגילים בנושאים ניטרליים אך סירוב תפקודי ברגישים. מחקר חדש חושף את התופעה בדיאלוג ארוך ומציע מסגרת ביקורת. קראו את הניתוח המלא.
קרא עודמחקר חדש חושף כי קוונטיזציה ל-NF4 ב-Llama 3 8B כמעט לא פוגעת בהיגיון סיבתי, עם שיפור מ-GraphRAG. קראו על הממצאים המפתיעים.
קרא עודValuePilot מציגה דרך חדשה לקבלת החלטות AI מבוססת ערכים אישיים, עם ביצועים עליונים על מודלים מובילים. קראו על המסגרת הדו-שלבית שמשנה את כללי המשחק. קראו עכשיו.
קרא עודמודלי שפה גדולים נכשלים בתעשיות מוסדרות עקב אי-יציבות. מחקר חדש מציג צינור הערות AI המשלב בני אדם ומכונות לתיקון בעיות. קראו על הפתרון המדרגי.
קרא עודמחקר חדש מוכיח: מתמטיקה וקידוד הן הבנצ'מרקים האוניברסליים לבדיקת סוכני AI. קראו כיצד זה משנה את כללי המשחק בפיתוח AI עסקי.
קרא עודסוכני LLM מתקדמים כמו O3 מצליחים לשבור סימטריה בגרפים מבוזרים דרך LoopBench החדש, בניגוד למודלים רגילים. קראו עכשיו על הבנצ'מרק שחושף בינה קולקטיבית. (112 מילים)
קרא עודמודלי שפה קטנים יכולים לשנות את חקלאות החלב בישראל. מחקר חדש מזהה את Qwen-4B כמוביל בביצוע משימות החלטה על חומרה מקומית. קראו על התוצאות והמשמעויות.
קרא עודבעידן הלמידה המכונית, תוויות רועשות פוגעות בביצועים. Adjudicator, מערכת חדשה, משתמשת בגרף ידע ומועצת סוכני LLM כדי להשיג 99% דיוק. קראו על הפריצה הזו עכשיו! (92 מילים)
קרא עודמחקר חדש ב-arXiv בודק מודלי LLM מתקדמים על הוכחות מתמטיות מספר אלגוריתמים רנדומליים. Gemini ו-Claude מובילים עם 66% דיוק. קראו עכשיו לפרטים מלאים.
קרא עודסנאטורים אמריקאים פתחו בחקירה נגד חברות AI על השפעת מרכזי הנתונים על מחירי החשמל. מחקר מצביע על זינוק של 267% באזורים סמוכים. קראו את הפרטים המלאים.
קרא עודOpenAI משדרגת את יצירת התמונות ב-ChatGPT ל-GPT Image 1.5 עם דיוק גבוה יותר בעריכה ועקביות. קראו על השיפורים העסקיים ועל התחרות מול גוגל.
קרא עודקארוליין מרין, יוצאת אובר איטס, גייסה 14 מיליון דולר ל-Leona Health – עוזר AI שמסדר כאוס ווטסאפ לרופאים בלטאם ומחסך 2-3 שעות יומיות. קראו על הפתרון שמשנה את התקשורת הרפואית. (92 מילים)
קרא עודOpenAI משיקה GPT-Image-1.5 – דגם יצירת תמונות מהיר פי 4 עם עריכה מדויקת, בתגובה ל"קוד אדום" מול גוגל. קראו את הפרטים המלאים.
קרא עודמטא מעדכנת את משקפי ה-AI שלה עם תכונה שמגבירה שיחות בסביבות רועשות, בתוספת שילוב ספוטיפיי חכם. קראו על הפיצ'רים החדשים שמשנים את חוויית השמיעה. קראו עכשיו!
קרא עוד