בעידן שבו בינה מלאכותית מבטיחה לשנות את עולם הרפואה, סוכנים קליניים מבוססי מודלי שפה קטנים כמו TxAgent נתקלים בכשל קריטי: הם מצליחים לאחזר מידע ביורפואי, אך נכשלים בשימוש בו לנשיאה מדויקת. מחקר חדש מציג את קיוראייג'נט – מסגרת Executor-Analyst שמפרידה בין ביצוע כלים מדויק לבין חשיבה סמנטית חזקה, ומשפרת משמעותית את האמינות.
המסגרת מבוססת על שילוב של 'מבצעים' (Executors) – סוכני TxAgent מיוחדים לביצוע משימות סינטקטיות – עם 'אנליסטים' (Analysts) – מודלי בסיס ארוכי-הקשר לניתוח עמוק. על פי החוקרים, גישה זו מתגברת על חולשות המודלים המונוליטיים. בנוסף, אסטרטגיית Stratified Ensemble שומרת על גיוון ראיות ומנצחת אגרגציה גלובלית, ומפחיתה צווארי בקבוק מידעיים.
בבדיקות לחץ, נחשפו תובנות חשובות: פרדוקס ביצועים-הקשר, שבו הקשרים מעבר ל-12 אלף אסימונים מוסיפים רעש ופוגעים בדיוק; ומקלל ממדיות בחללי פעולה, שדורש אחזור היררכי ככל שכלי העבודה גדלים. קיוראייג'נט משיגה ביצועים ברמה עולמית בבנצ'מרק CURE-Bench ללא צורך בכוונון עדין יקר.
הגישה מדגישה את כוחה של הנדסת ארכיטקטורה ללא אימון, ומספקת בסיס גמיש לקנה מידה עבור טיפולים מבוססי AI אמינים. בהשוואה לפתרונות קודמים, היא מציעה שיפור משמעותי ביכולת שימוש במידע רפואי מורכב, רלוונטי במיוחד למערכות בריאות ישראליות שמתמודדות עם נתונים רבים.
למנהלי עסקים בתחום הבריאות, קיוראייג'נט פותחת אפשרויות לשילוב AI קליני מהיר ללא השקעות כבדות באימון. הקוד זמין בגיטהאב, מה שמאפשר ניסויים מיידיים. האם זו ההתחלה של דור חדש של סוכנים רפואיים אמינים?