האם סוכני AI עומדים להחליף עורכי דין? חודש שעבר עוד נראה רחוק, עם ציונים נמוכים מתחת ל-25% בבנצ'מרק של Mercor למשימות משפטיות וניתוח תאגידי. אך כעת, דגם Opus 4.6 של Anthropic משנה את חוקי המשחק ומשיג כמעט 30% בניסוי one-shot, וממוצע של 45% לאחר כמה ניסיונות. קפיצה זו, מדווח TechCrunch, מעידה על התקדמות מהירה ביכולות סוכני AI.
בנצ'מרק APEX-Agents של Mercor בודק יכולות סוכני AI במשימות מקצועיות מורכבות כמו ניתוח משפטי. בחודש שעבר, כל מעבדות ה-AI המובילות נכשלו עם ציונים נמוכים. אולם, השבוע פרסמה Anthropic את Opus 4.6, שכללה תכונות חדשות כמו 'סווארמי סוכנים' – קבוצות סוכנים שפותרת בעיות רב-שלביות. התוצאה: 29.8% לעומת 18.4% קודם, קפיצה מטורפת לדברי מנכ"ל Mercor, ברנדן פודי.
השיפור הזה אינו מקרי. הוא משקף התקדמות מתמשכת במודלי יסוד של AI, שלא מאטה. פודי ציין כי "קפיצה מ-18.4% ל-29.8% בחודשים ספורים היא מטורפת". למרות זאת, 30% רחוק מ-100%, ועורכי דין אינם צריכים לארוז מזוודות השבוע. עם זאת, הביטחון שלהם צריך להיות פחות מוחלט משהיה.
למנהלי עסקים בישראל, ההתפתחות הזו פירושה הזדמנויות חדשות. סוכני AI יכולים לסייע בניתוח חוזים, בדיקת תקנות וביצוע משימות שגרתיות, ולחסוך זמן וכסף. חברות כמו Anthropic מציעות כלים שמתקרבים לרמה מקצועית, ויש לבחון אינטגרציה במערכות משפטיות ועסקיות מקומיות.
מה זה אומר לעתיד? אם הקצב נמשך, סוכני AI עשויים להפוך לשותפים חיוניים במשרדי עורכי דין בתוך שנים ספורות. עורכי דין חכמים יאמצו את הטכנולוגיה מוקדם, כדי להישאר תחרותיים. האם אתם מוכנים לשינוי?