האם סוכני AI מבוססי מודלי שפה גדולים (LLM) מוכנים לשנות את עולם הרפואה? מחקר חדש שפורסם ב-arXiv בוחן 49 מחקרים ומציג טקסונומיה במידות שבע לבחינה אמפירית של סוכני LLM בבריאות ומדעי הרפואה. המסגרת הזו מזהה א-סימטריות חמורות ביכולות: בעוד ששילוב ידע חיצוני נפוץ (76% מיושם במלואו), יכולות כמו זיהוי שינויים והפעלה אירועית חסרות כמעט לחלוטין (92%-98% לא מיושמות). זה מעלה שאלות קשות על מוכנות הטכנולוגיה ליישומים קליניים אמיתיים.
הטקסונומיה כוללת שבעה ממדים מרכזיים: יכולות קוגניטיביות, ניהול ידע, דפוסי אינטראקציה, הסתגלות ולמידה, בטיחות ואתיקה, טיפולוגיית מסגרות ומשימות ליבה ותת-משימות – עם 29 תת-ממדים מפורטים. החוקרים השתמשו בקריטריונים ברורים של הכלה והחרגה, וכן בגיליון סימון (מיושם במלואו, חלקי או לא מיושם) כדי למפות כל אחד מ-49 המחקרים. לפי הדיווח, סוכני LLM מצטיינים במשימות מרכזיות כמו ניתוח תיקים רפואיים, אבחון דיפרנציאלי, תכנון טיפול ומחקר, אך הסקירות הקיימות מתמקדות בהיבטים צרים מדי.
באופן ארכיטקטוני, עיצוב רב-סוכנים שולט (82% מיושם במלואו), בעוד ששכבות תזמון נשארות חלקיות ברוב המקרים. במשימות הליבה, יכולות מוכוונות מידע כמו מענה לשאלות רפואיות ותמיכת החלטות מובילות, לצד ביצועים ובדיקות סימולציה. לעומת זאת, תחומים פעלתניים כמו תכנון טיפול והנחיות כתיבת מרשמים סובלים מפערים משמעותיים (כ-59% לא מיושמים). ניהול ידע חיצוני בולט כחוזק מרכזי.
הניתוח החשף דפוסי שכיחות וקשרים בין יכולות, ומדגיש צורך במסגרת משותפת לעולם הרפואה. בישראל, שבה AI רפואי מתפתח במהירות עם שיתופי פעולה כמו של חברות סטארט-אפ מקומיות עם בתי חולים, הממצאים הללו רלוונטיים במיוחד. הם מצביעים על אזורים חלשים שדורשים השקעה, כמו זיהוי שינויים והתאמה דינמית, כדי למנוע סיכונים קליניים.
למנהלי עסקים בתחום הבריאות, המחקר הזה קורא לפעולה: אמצו את הטקסונומיה לבחינת פתרונות AI, התמקדו בפיתוח יכולות חסרות והשקיעו בבטיחות. מה תהיה ההשפעה של סוכני LLM על שירותי הרפואה שלכם?