בעולם שבו ניתוחי נתונים בפיזיקה של אנרגיה גבוהה (HEP) דורשים חודשים של עבודה אנושית, חוקרים מציגים גישה חדשנית: סוכני שפה גדולים (LLM) שמאטומטים את התהליך כולו. במחקר הוכחת-עיקרון זה, שפורסם ב-arXiv ומקובל לכנס NeurIPS 2025, נבחרה מדידת חתך הדיפוטון של בוזון היגס כמקרה בוחן, תוך שימוש בנתוני ATLAS Open Data. המערכת ההיברידית משלבת סוכן LLM המשמש כמפקח-מקודד עם מנהל זרימת העבודה Snakemake, המבטיח חזרתיות ודטרמיניזם. (72 מילים)
הסוכן הפועל באופן אוטונומי מייצר, מבצע ומתקן באופן איטרטיבי קוד ניתוח בהתאם להוראות המשתמש. המחקר מגדיר מדדי הערכה כמותיים כמו שיעור הצלחה, התפלגות שגיאות, עלויות למשימה ספציפית ומספר קריאות API ממוצע, לבחינת ביצועי הסוכן על פני זרימות עבודה רב-שלביות. נבדקו דגמים מתקדמים מסדרות Gemini ו-GPT-5, משפחת Claude ודגמי משקל פתוח מובילים. למרות הגדרת טמפרטורה לאפס, הפלטים הסופיים מציגים שונות סטוכסטית עקב פרמטרי דגימה אחרים. (98 מילים)
מנהל הזרימה Snakemake אוכף ביצוע דטרמיניסטי של כל שלבי הניתוח, אך הדגמים אינם מייצרים תוצאות זהות לחלוטין. המחקר קובע את המסגרת הראשונה המונעת על ידי סוכני LLM לניתוח נתונים אוטומטי ב-HEP, המאפשרת בדיקת שיטתית של יכולות הדגמים, יציבות ומגבלות בסביבות מחשוב מדעיות אמיתיות. קוד הבסיס זמין בכתובת https://huggingface.co/HWresearch/LLM4HEP. (82 מילים)
משמעות המחקר רבה: הוא פותח דרך לאוטומציה של ניתוחים מורכבים בפיזיקה, מה שיכול לחסוך זמן ומשאבים לחוקרים. בהשוואה לשיטות מסורתיות, הסוכנים מאפשרים התאמה מהירה להוראות ומתקנים שגיאות אוטומטית. בישראל, שבה מוסדות כמו מכון ויצמן ומכון וויצמן עוסקים בפיזיקת חלקיקים וב-AI, הגישה הזו יכולה לשפר שיתופי פעולה עם CERN ו-ATLAS. (78 מילים)
עבור מנהלי עסקים וחברות טכנולוגיה, המחקר מדגים כיצד סוכני LLM יכולים להחליף תהליכים ידניים בתחומי נתונים מדעיים. הוא מזמין בדיקת יכולות דגמי AI בסביבות אמיתיות, תוך התחשבות בשונות ובצורך בשיפור יציבות. מה תהיה ההשפעה על מחקר מדעי ישראלי? קוד זמין – נסו בעצמכם. (68 מילים)