סוכני LLM מאטומטים ניתוח נתונים בפיזיקת חלקיקים
מחקר

סוכני LLM מאטומטים ניתוח נתונים בפיזיקת חלקיקים

מחקר חלוצי משלב סוכני שפה גדולים עם כלי זרימה לאוטומציה מלאה של ניתוחי HEP – כולל מדידת חתך Higgs

2 דקות קריאה

תקציר מנהלים

נקודות עיקריות

  • מערכת היברידית: סוכן LLM + Snakemake לניתוח HEP אוטומטי.

  • בדיקת דגמים: Gemini, GPT-5, Claude ועוד – עם מדדי הצלחה מדויקים.

  • זמין לקוד: https://huggingface.co/HWresearch/LLM4HEP.

  • מקובל ל-NeurIPS 2025 ML4PS.

סוכני LLM מאטומטים ניתוח נתונים בפיזיקת חלקיקים

  • מערכת היברידית: סוכן LLM + Snakemake לניתוח HEP אוטומטי.
  • בדיקת דגמים: Gemini, GPT-5, Claude ועוד – עם מדדי הצלחה מדויקים.
  • זמין לקוד: https://huggingface.co/HWresearch/LLM4HEP.
  • מקובל ל-NeurIPS 2025 ML4PS.
בעולם שבו ניתוחי נתונים בפיזיקה של אנרגיה גבוהה (HEP) דורשים חודשים של עבודה אנושית, חוקרים מציגים גישה חדשנית: סוכני שפה גדולים (LLM) שמאטומטים את התהליך כולו. במחקר הוכחת-עיקרון זה, שפורסם ב-arXiv ומקובל לכנס NeurIPS 2025, נבחרה מדידת חתך הדיפוטון של בוזון היגס כמקרה בוחן, תוך שימוש בנתוני ATLAS Open Data. המערכת ההיברידית משלבת סוכן LLM המשמש כמפקח-מקודד עם מנהל זרימת העבודה Snakemake, המבטיח חזרתיות ודטרמיניזם. (72 מילים) הסוכן הפועל באופן אוטונומי מייצר, מבצע ומתקן באופן איטרטיבי קוד ניתוח בהתאם להוראות המשתמש. המחקר מגדיר מדדי הערכה כמותיים כמו שיעור הצלחה, התפלגות שגיאות, עלויות למשימה ספציפית ומספר קריאות API ממוצע, לבחינת ביצועי הסוכן על פני זרימות עבודה רב-שלביות. נבדקו דגמים מתקדמים מסדרות Gemini ו-GPT-5, משפחת Claude ודגמי משקל פתוח מובילים. למרות הגדרת טמפרטורה לאפס, הפלטים הסופיים מציגים שונות סטוכסטית עקב פרמטרי דגימה אחרים. (98 מילים) מנהל הזרימה Snakemake אוכף ביצוע דטרמיניסטי של כל שלבי הניתוח, אך הדגמים אינם מייצרים תוצאות זהות לחלוטין. המחקר קובע את המסגרת הראשונה המונעת על ידי סוכני LLM לניתוח נתונים אוטומטי ב-HEP, המאפשרת בדיקת שיטתית של יכולות הדגמים, יציבות ומגבלות בסביבות מחשוב מדעיות אמיתיות. קוד הבסיס זמין בכתובת https://huggingface.co/HWresearch/LLM4HEP. (82 מילים) משמעות המחקר רבה: הוא פותח דרך לאוטומציה של ניתוחים מורכבים בפיזיקה, מה שיכול לחסוך זמן ומשאבים לחוקרים. בהשוואה לשיטות מסורתיות, הסוכנים מאפשרים התאמה מהירה להוראות ומתקנים שגיאות אוטומטית. בישראל, שבה מוסדות כמו מכון ויצמן ומכון וויצמן עוסקים בפיזיקת חלקיקים וב-AI, הגישה הזו יכולה לשפר שיתופי פעולה עם CERN ו-ATLAS. (78 מילים) עבור מנהלי עסקים וחברות טכנולוגיה, המחקר מדגים כיצד סוכני LLM יכולים להחליף תהליכים ידניים בתחומי נתונים מדעיים. הוא מזמין בדיקת יכולות דגמי AI בסביבות אמיתיות, תוך התחשבות בשונות ובצורך בשיפור יציבות. מה תהיה ההשפעה על מחקר מדעי ישראלי? קוד זמין – נסו בעצמכם. (68 מילים)

שאלות ותשובות

שאלות נפוצות

אהבתם את הכתבה?

הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל

המידע שתמסור ישמש ליצירת קשר ומתן שירותים. למידע נוסף ראה מדיניות פרטיות ותנאי שימוש

עוד כתבות שיעניינו אותך

לכל הכתבות
כמה שכיחים דפוסי החלשה בצ'טבוטי AI?
מחקר
2 דקות

כמה שכיחים דפוסי החלשה בצ'טבוטי AI?

האם סיפורי הזוועה על צ'טבוטי AI שמובילים משתמשים לפעולות מזיקות הם מקרים בודדים או בעיה נפוצה? אנתרופיק בדקה 1.5 מיליון שיחות עם קלוד. קראו עכשיו את הניתוח המלא.

AnthropicClaudeUniversity of Toronto
קרא עוד
Table-BiEval: הערכת מבנה ב-LLM ללא בני אדם
מחקר
2 דקות

Table-BiEval: הערכת מבנה ב-LLM ללא בני אדם

מודלי שפה גדולים מתקשים בתרגום שפה טבעית למבנים מדויקים. Table-BiEval, מסגרת חדשה ללא בני אדם, חושפת חולשות ומפתיעה: מודלים בינוניים מנצחים ענקיים. קראו עכשיו על הפריצה הזו!

Table-BiEvalLLMs
קרא עוד