בעידן שבו מודלי שפה גדולים (LLM) משנים את פני הרפואה, עולה השאלה: האם 'דיגיטל טווינס' אנושיים מבוססי LLM מסוגלים לדמות במדויק תכונות פסיכולוגיות מורכבות כמו חוסר אמון במערכת הבריאות? מחקר חדש שפורסם ב-arXiv בודק זאת ומגלה מגבלות משמעותיות. החוקרים השתמשו במאגר נתונים Twin-2K-500 ובסקאלת חוסר האמון במערכת הבריאות (HCSDS) כדי להשוות תגובות סימולטיביות לתגובות אנושיות אמיתיות.
התוצאות מראות כי התגובות שיצרו הדיגיטל טווינס היו מרוכזות יותר, עם שונות נמוכה יותר ובחירות פחות קיצוניות (כל הפרמטרים עם p<0.001). בעוד שהסימולציה שיחזרה דפוסים דמוגרפיים עיקריים כמו גיל ומגדר, היא נכשלה בלכידת הבדלים עדינים ברמות השכלה. לפי הדיווח, הדיגיטל טווינס מצליחים לשקף מגמות אוכלוסייה כלליות, אך מתקשים בהבחנות מדויקות בין תת-קבוצות.
הממצאים מדגישים את הפוטנציאל של הכלי הזה במחקר מערכות בריאות, אך גם את האתגרים. אנשי מקצוע רפואיים עלולים להסתמך על סימולציות כאלה בעבודתם השגרתית, אך חוסר הדיוק עלול לפגוע באמון. המחקר ממליץ על כיול קפדני והערכה לפני שימוש בניתוחים השלכתיים או סימולציות מדיניות.
בהקשר ישראלי, שבו מערכת הבריאות סובלת מאתגרי אמון דומים, הכלי יכול לסייע בתכנון שיפורים – אך רק אם יותאם נכון. בהשוואה לכלים אחרים, דיגיטל טווינס מבוססי LLM מציעים יתרון במהירות ובקנה מידה, אך דורשים שיפור במודלים רגשיים.
לסיכום, הדיגיטל טווינס מבוססי LLM מבטיחים עתיד מבריק אך זקוקים לשכלול. מנהלי בריאות צריכים לשאול: האם הסימולציה הזו אמינה מספיק להחלטות עסקיות? מחקרים עתידיים חייבים לבחון מנגנוני חשיבה רגשית ב-LLM לפני יישום בנושאים רגישים.