בעידן שבו מודלי היגיון גדולים (LRMs) מצטיינים בהיגיון רב-שלבי אך סובלים מבזבוז משאבים על היגיון מיותר כמו 'חשיבה יתר' ו'חריגה', חוקרים מציגים את Think-with-Me – פרדיגמה אינטראקטיבית חדשה לזמן מבחן. השיטה מאפשרת התערבות חיצונית במקומות טבעיים של חיבורים מעבריים, שבהם המודל מאמת את עצמו או חוקר. לפי המחקר, שימוש נכון בחיבורים כאלה מאריך היגיון ומשפר ביצועים, בעוד שימוש מוגזם פוגע. Think-with-Me עוצרת את ההיגיון בנקודות אלה לקבלת משוב חיצוני, ומחליטה להאריך או לסיים כדי להפחית כפילות תוך שמירה על דיוק. (72 מילים)
הבעיה המרכזית במודלי LRMs היא תהליכי היגיון סגורים שאינם מאפשרים התערבות חיצונית, מה שגורם לעלויות גבוהות וירידת ביצועים. Think-with-Me פותרת זאת באמצעות משוב רב-קריטרי (רציונליות ושלמות) ממקורות אנושיים או מודלי LLM. המודל היעד מאומן באמצעות אופטימיזציית מדיניות יחסית קבוצתית (GRPO) כדי להסתגל למצב אינטראקטיבי זה. השיטה משלבת תובנות על חיבורים מעבריים כנקודות התערבות טבעיות, ומשפרת את איזון הדיוק ואורך ההיגיון. (92 מילים)
בניסויים על מבחן AIME24, Think-with-Me עלתה על QwQ-32B ב-7.19% דיוק תחת חלון הקשר של 8K טוקנים, תוך קיצור אורך ההיגיון הממוצע ב-81%. השיטה מועילה גם למשימות אבטחה ויצירתיות. החוקרים מדגישים כי התערבות חכמה מפחיתה בזבוז ומשמרת ביצועים גבוהים, גם בחלונות הקשר מוגבלים. זהו צעד משמעותי לקראת היגיון יעיל יותר במודלי AI גדולים. (85 מילים)
בהשוואה לשיטות קיימות כמו QwQ שפועלות בסביבה סגורה, Think-with-Me מציעה גמישות עם התערבות דינמית. זה רלוונטי במיוחד לעסקים ישראליים בתחום ההייטק, שבהם מודלי AI משמשים לפיתוח תוכנה, ניתוח נתונים ואוטומציה. השילוב של משוב אנושי או LLM מאפשר התאמה מהירה לצרכים ספציפיים, ומפחית עלויות חישוב. בישראל, עם מרכזי AI מתקדמים כמו במכון ויצמן ובסטארט-אפים בתל אביב, פרדיגמה זו יכולה להאיץ חדשנות. (88 מילים)
Think-with-Me פותחת אפשרויות חדשות לעסקים: הפחתת זמן חישוב במודלי היגיון, שיפור דיוק במשימות מורכבות ושילוב משוב עובדים. עבור מנהלי טכנולוגיה, זה אומר ROI גבוה יותר מהשקעות ב-AI. המחקר מרמז על פוטנציאל להרחבה למשימות נוספות. מה תהיה ההשפעה על כלי AI בעסקים שלכם? (68 מילים)