בעידן שבו דגמי שפה גדולים (LLM) משנים את עולם הרפואה, אתגר מרכזי הוא הפעלה מקומית ללא ענן – בגלל פרטיות ותלות בתשתיות. מחקר חדש ב-arXiv בודק שני מודלים על-מכשיר: gpt-oss-20b ו-gpt-oss-120b, במשימות אבחון מחלות כללי, אבחון ומעקב בעיניים, וסימולציית דירוג מומחים. לפי המחקר, המודלים הללו משיגים תוצאות דומות או טובות יותר מדגם קוד פתוח מוביל כמו DeepSeek-R1 ומדגם o4-mini, למרות גודלם הקטן יותר.
המחקר השווה את הביצועים לדגמים קנייניים מתקדמים כמו GPT-5. בתוצאות, gpt-oss-120b ו-gpt-oss-20b מתקרבים לביצועי o4-mini וחורגים מ-DeepSeek-R1 במשימות אבחון. בנוסף, כוונון עדין (fine-tuning) של gpt-oss-20b על נתוני אבחון כללי שיפר את דיוקו באופן דרמטי, והביא אותו קרוב לביצועי GPT-5. זה מדגיש את הפוטנציאל של מודלי LLM על-מכשיר בסביבות רפואיות מוגבלות במשאבים.
למה זה חשוב? מודלים על-מכשיר מאפשרים עיבוד מקומי, שומר על פרטיות נתוני מטופלים ומפחית תלות בענן. בעוד דגמים גדולים דורשים חומרה כבדה, gpt-oss מציעים פתרון פרקטי לקליניקות. השוואה למודלים קוד פתוח אחרים מראה עליונות, מה שמקל על אימוץ בישראל, שבה פרטיות רפואית קריטית.
ההשלכות לעסקים רפואיים בישראל רבות: חברות מדטק יכולות לשלב כלים כאלה באפליקציות ניידות לאבחון מהיר. כוונון מקומי על נתונים ישראליים יכול לשפר דיוק. זה פותח דלת לשילוב AI ברפואה שגרתית, ללא סיכוני ענן.
בקיצור, מחקר זה מצביע על עתיד שבו LLM על-מכשיר יהפכו לסטנדרט בתמיכה רפואית. מנהלי בתי חולים – כדאי לבדוק כלים כאלה עכשיו?