בעידן שבו מודלי שפה גדולים (LLMs) משנים את פני עולם הבינה המלאכותית, הם עדיין מתקשים במשימות היגיון מורכבות כמו חישובים מתמטיים והסקת מסקנות לוגיות. חוקרים מציגים את PREGU – שיטת Partial Reasoning Guided by Uncertainty – שמבטיחה להתגבר על מגבלות אלה. השיטה עוקבת אחר אנטרופיית התפלגות הפלט ומפסיקה את התהליך ברגע שמתגלה אי ודאות גבוהה, כדי לבצע שיפור ממוקד. זהו צעד משמעותי לקראת AI אמין יותר בעסקים.
PREGU פועלת במהלך יצירה אוטורגרסיבית של הטקסט, כאשר היא מנטרת את האנטרופיה של התפלגות ההסתברות בכל צעד. כאשר האנטרופיה עולה מעל סף מוגדר – סימן לאי ודאות – התהליך נעצר. בשלב זה, השיטה מבצעת חיפוש מקומי במרחב הסמוי (latent space) כדי לחדד את ההיגיון החלקי ולבחור את התשובה ההגיונית ביותר. השיפור מבוסס על שיטת Soft Reasoning, שמאפשרת חקירה גמישה יותר של אפשרויות.
המחקר בדק את PREGU על שלושה מודלים פופולריים: LLaMA-3-8B, Mistral-7B ו-Qwen2-7B. הבדיקות התבצעו על ארבעה בנצ'מרקים מרכזיים להיגיון: GSM8K, GSM-Hard, SVAMP ו-StrategyQA. התוצאות הראו ביצועים גבוהים יותר או שווים לאלו של Soft Reasoning לבדה, מה שמעיד כי האנטרופיה משמשת כסיגנל יעיל להפעלת שיפור סלקטיבי.
משמעותה של PREGU בעולם העסקי היא עצומה. חברות ישראליות המפתחות פתרונות AI יכולות להשתמש בשיטה זו כדי לשפר את אמינות המודלים במשימות קריטיות כמו תכנון אסטרטגי או ניתוח נתונים פיננסיים. בהשוואה לשיטות קודמות, PREGU מציעה גישה ממוקדת יותר, שחוסכת משאבים ומגבירה דיוק ללא צורך באימון מחדש של המודל כולו. זה רלוונטי במיוחד לענף ההייטק בישראל, שמוביל בחדשנות AI.
לסיכום, PREGU מדגימה כיצד ניתן לרתום אי ודאות ככלי לשיפור היגיון במודלי שפה. מנהלי עסקים צריכים לשקול אינטגרציה של טכניקות כאלה בפלטפורמות שלהם. האם זו ההתחלה של דור חדש של AI שחושב כמו אדם? קראו את המאמר המלא ב-arXiv כדי להעמיק.