בעולם שבו מודלי שפה גדולים (LLMs) משמשים לקבלת החלטות אסטרטגיות, עולה השאלה: האם הנחיית פרסונה באמת משנה את התנהגותם? מחקר חדש, שפורסם ב-arXiv, בוחן זאת במשחק הלוח PERIL – משחק כיבוש עולמי שפותח כקוד פתוח. החוקרים גילו כי פרסונות מסוימות, הקשורות לחשיבה אסטרטגית, משפרות את הביצועים – אך רק כאשר משתמשים במתווך שמתרגם את תגובות ה-LLM להנחיות מעשיות.
המחקר משווה בין אסטרטגיות הנגזרות מפרסונות לאלו שנבחרו ידנית. פרסונות כמו 'אסטרטגן צבאי' או 'מנהל עסקי מנוסה' נבחנו במשחק PERIL, שמדמה סביבה תחרותית ואדוורסריאלית. התוצאות מראות כי ללא מתווך, ההשפעה מוגבלת. המתווך, בהשראת ניתוח גורמים חקרני (EFA), מפרש תגובות מ-LLM לשאלון פרסונה להנחיות כמותיות אמינות יותר. כך, הפרסונות הופכות לכלי מדיד ומשפרות את הביצועים במשחק.
מה הופך את המתווך ליעיל? הוא מבטיח תוקף פנים (face validity) והגברת אמינות ההנחיות בהשוואה להסקה ישירה מפרסונות. החוקרים מדווחים כי שיטה זו מאפשרת מחקר מדויק יותר של השפעת סוגי פרסונות על קבלת החלטות ב-LLMs. PERIL, כמשחק פשוט אך מורכב אסטרטגית, מספק סביבה מבוקרת לבדיקה זו, בניגוד לסביבות מופשטות יותר.
לעסקים ישראליים, התובנות רלוונטיות במיוחד. חברות המשתמשות ב-LLM לאוטומציה של תהליכי קבלת החלטות – כמו תמחור דינמי או ניהול סיכונים – יכולות להרוויח משיטת המתווך. היא מאפשרת התאמה מדויקת יותר של פרסונות לצרכים ספציפיים, ומשפרת את האמינות של המלצות ה-AI. בהשוואה לשיטות קיימות, הגישה הזו מביאה תקפות פסיכומטרית למודלים.
המחקר מציע שיטה חדשה לייצור הנחיות מפרסונות, תוך שילוב עקרונות פסיכומטריים. הוא מדגיש כי פרסונות משפיעות על סגנון, אך ההשפעה על התנהגות אסטרטגית דורשת תרגום מובנה. עבור מנהלי טכנולוגיה, זו הזדמנות לבחון כיצד לשפר את LLMs במשימות אמיתיות. מה תהיה ההשפעה על יישומים עסקיים?