מהו בנצ'מרק APEX-Agents?

בדיקה של יכולות סוכני AI במשימות מקצועיות כמו ניתוח משפטי ותאגידי.

מה הציון של Opus 4.6?

כמעט 30% בניסוי one-shot, וממוצע 45% עם ניסיונות נוספים.

האם AI מחליף עורכי דין?

עדיין לא, אך ההתקדמות מהירה ודורשת התאמה.

חדשות

סוכני AI קרובים יותר לעריכת דין: קפיצה ל-30%

Anthropic Opus 4.6 שובר שיאים בבנצ'מרק Mercor – האם עורכי דין צריכים להדאיג?

צוות אוטומציות AI

6 בפברואר 2026

3 דקות קריאה

מבוסס על כתבה שלTechCrunch ↗תרגום, סיכום והקשר עסקי על-ידי המערכתאיך אנחנו עובדים

✨תקציר מנהלים

נקודות עיקריות

Anthropic Opus 4.6 משיג 29.8% one-shot בבנצ'מרק Mercor.
קפיצה מ-18% ל-30% תוך חודשים ספורים.
תכונות חדשות כמו סווארמי סוכנים משפרות פתרון בעיות מורכבות.
עדיין רחוק מ-100%, אך התקדמות מהירה.
הזדמנות לעסקים: אוטומציה של משימות משפטיות.

סוכני AI קרובים יותר לעריכת דין: קפיצה ל-30%

Anthropic Opus 4.6 משיג 29.8% one-shot בבנצ'מרק Mercor.
קפיצה מ-18% ל-30% תוך חודשים ספורים.
תכונות חדשות כמו סווארמי סוכנים משפרות פתרון בעיות מורכבות.
עדיין רחוק מ-100%, אך התקדמות מהירה.
הזדמנות לעסקים: אוטומציה של משימות משפטיות.

האם סוכני AI עומדים להחליף עורכי דין? חודש שעבר עוד נראה רחוק, עם ציונים נמוכים מתחת ל-25% בבנצ'מרק של Mercor למשימות משפטיות וניתוח תאגידי. אך כעת, דגם Opus 4.6 של Anthropic משנה את חוקי המשחק ומשיג כמעט 30% בניסוי one-shot, וממוצע של 45% לאחר כמה ניסיונות. קפיצה זו, מדווח TechCrunch, מעידה על התקדמות מהירה ביכולות סוכני AI.

בנצ'מרק APEX-Agents של Mercor בודק יכולות סוכני AI במשימות מקצועיות מורכבות כמו ניתוח משפטי. בחודש שעבר, כל מעבדות ה-AI המובילות נכשלו עם ציונים נמוכים. אולם, השבוע פרסמה Anthropic את Opus 4.6, שכללה תכונות חדשות כמו 'סווארמי סוכנים' – קבוצות סוכנים שפותרת בעיות רב-שלביות. התוצאה: 29.8% לעומת 18.4% קודם, קפיצה מטורפת לדברי מנכ"ל Mercor, ברנדן פודי.

השיפור הזה אינו מקרי. הוא משקף התקדמות מתמשכת במודלי יסוד של AI, שלא מאטה. פודי ציין כי "קפיצה מ-18.4% ל-29.8% בחודשים ספורים היא מטורפת". למרות זאת, 30% רחוק מ-100%, ועורכי דין אינם צריכים לארוז מזוודות השבוע. עם זאת, הביטחון שלהם צריך להיות פחות מוחלט משהיה.

למנהלי עסקים בישראל, ההתפתחות הזו פירושה הזדמנויות חדשות. סוכני AI יכולים לסייע בניתוח חוזים, בדיקת תקנות וביצוע משימות שגרתיות, ולחסוך זמן וכסף. חברות כמו Anthropic מציעות כלים שמתקרבים לרמה מקצועית, ויש לבחון אינטגרציה במערכות משפטיות ועסקיות מקומיות.

מה זה אומר לעתיד? אם הקצב נמשך, סוכני AI עשויים להפוך לשותפים חיוניים במשרדי עורכי דין בתוך שנים ספורות. עורכי דין חכמים יאמצו את הטכנולוגיה מוקדם, כדי להישאר תחרותיים. האם אתם מוכנים לשינוי?

שאלות ותשובות

שאלות נפוצות

הכתבה הוכנה על-ידי המערכת בליווי בינה מלאכותית: תרגום, סיכום והוספת הקשר עסקי ישראלי מתוך פרסום מקורי של TechCrunch. קראו על תהליך העריכה שלנו. קישור למקור המקורי.

אהבתם את הכתבה?

הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל

עוד מ־TechCrunch

כל הכתבות מ־TechCrunch

אוטומציה של משימות באייפון: המהפכה של Apple Intelligence

חדשות

לפני 12 דקות

4 דקות

מ־TechCrunch

אוטומציה של משימות באייפון: המהפכה של Apple Intelligence

במסגרת כנס המפתחים האחרון, חשפה חברת Apple שורה של עדכוני בינה מלאכותית משמעותיים לפלטפורמת Apple Intelligence. העדכונים כוללים אפשרות לבניית קיצורי דרך מורכבים במערכת ההפעלה iOS באמצעות הנחיות טקסט פשוטות (Natural Language), ניהול כרטיסיות ושינויים חכם בדפדפן Safari, ויכולת שליפת הקשרים חוצת-אפליקציות בזמן שיחות טלפון. מדובר בשינוי מהותי באופן שבו עסקים ומנהלים יכולים לבצע אוטומציה של משימות באייפון ללא ידע בקוד. עבור עסקים בישראל, מדובר בהזדמנות לייעל תהליכי עבודה ניידים של עובדי שטח ומנהלים, לצד צורך בבחינה מדוקדקת של היבטי אבטחת מידע ופרטיות בהתאם לחוק הישראלי.

Apple Apple Intelligence Safari

קרא עוד

בינה מלאכותית של אפל ב-WWDC 2026: סירי החדשה וסוכני AI

חדשות

לפני 2 שעות

4 דקות

מ־TechCrunch

בינה מלאכותית של אפל ב-WWDC 2026: סירי החדשה וסוכני AI

כנס המפתחים העולמי של אפל (WWDC 2026) נפתח עם בשורות דרמטיות בתחום ה-AI. החברה מציגה שדרוג חסר תקדים לעוזרת הקולית Siri, שמתבססת על מודל Gemini של גוגל, לצד שילוב סוכני AI בחנות האפליקציות ומערכת Apple Intelligence משודרגת. פיתוחים אלו עומדים לשנות את האופן שבו עסקים ומשתמשי קצה מתקשרים עם מכשירי אפל ביום-יום, עם שדרוגים באפליקציות המצלמה, התמונות והארנק (Wallet) שמאפשרים עריכה חכמה, זיהוי אובייקטים וחלוקת תשלומים מהירה.

Apple Google Siri

קרא עוד

חישוב עלויות בינה מלאכותית לעסקים: עידן ה-Tokenpocalypse

ניתוח

לפני 22 שעות

4 דקות

מ־TechCrunch

חישוב עלויות בינה מלאכותית לעסקים: עידן ה-Tokenpocalypse

התקופה שבה כלי בינה מלאכותית (AI) הוצעו במחירים קבועים ונמוכים מגיעה לסיומה. בעקבות שינויי התמחור האחרונים של מיקרוסופט עבור GitHub Copilot ומגבלות התקציב של חברות כמו Uber, התעשייה נכנסת לעידן ה-'טוקנפוקליפסה' (Tokenpocalypse). המשמעות עבור עסקים ברורה: תמחור מבוסס שימוש ריאלי בטוקנים ולא עוד מנויים חודשיים ללא הגבלה. כדי להימנע מחריגות תקציביות חדות, חברות נדרשות לבצע אופטימיזציה של פניות ה-API שלהן, להשתמש במערכות אוטומציה חכמות המנתבות משימות בצורה חסכונית, ולבחון מעבר למודלים ממוקדים וקטנים יותר.

Microsoft GitHub Copilot Anthropic

קרא עוד

עדכוני סירי ואפל אינטליג'נס 2026: מה צפוי בכנס WWDC של אפל

חדשות

לפני 2 ימים

4 דקות

מ־TechCrunch

עדכוני סירי ואפל אינטליג'נס 2026: מה צפוי בכנס WWDC של אפל

כנס המפתחים WWDC 2026 של אפל צפוי להביא עמו שדרוג משמעותי לעוזרת הקולית סירי, המבוסס על שיתוף פעולה עם Google Gemini ויכולות הבנת הקשר רב-שלביות. לפי דיווחים, אפל תציג אפליקציית סירי עצמאית שתתחרה ב-ChatGPT ו-Claude, ותציע אפשרות למחיקה אוטומטית של שיחות. לצד זאת, החברה צפויה להציג חנות סוכני AI לביצוע משימות אוטומטיות, שיפורים דרמטיים באפליקציות המצלמה והתמונות באמצעות מנוע החיפוש החזותי של גוגל, ופיצ'ר חדש לפיצול חשבונות ב-Apple Wallet המבוסס על צילום קבלות. מדובר במהפכה תפעולית שעסקים חייבים להיערך אליה.

Apple Siri Google

קרא עוד

עוד כתבות שיעניינו אותך

לכל הכתבות

חדשות

לפני 12 דקות

4 דקות

מ־TechCrunch

אוטומציה של משימות באייפון: המהפכה של Apple Intelligence

Apple Apple Intelligence Safari

קרא עוד

חדשות

לפני 2 שעות

4 דקות

מ־TechCrunch

בינה מלאכותית של אפל ב-WWDC 2026: סירי החדשה וסוכני AI

Apple Google Siri

קרא עוד

חדשות

לפני 2 ימים

4 דקות

מ־TechCrunch

עדכוני סירי ואפל אינטליג'נס 2026: מה צפוי בכנס WWDC של אפל

Apple Siri Google

קרא עוד

הקמת מרכזי נתונים בינה מלאכותית בהודו: AirTrunk תשקיע 30 מיליארד דולר

חדשות

לפני 3 ימים

4 דקות

מ־TechCrunch

הקמת מרכזי נתונים בינה מלאכותית בהודו: AirTrunk תשקיע 30 מיליארד דולר

חברת תשתיות מרכזי הנתונים AirTrunk, המגובה על ידי בלקסטון, הכריזה על השקעת ענק של 30 מיליארד דולר בהודו עד שנת 2030. החברה מתכננת לפתח מרכזי נתונים ייעודיים לבינה מלאכותית בהספק כולל של 5 ג'יגה-ואט (GW). הפרויקט המרכזי יוקם במדינת מהאראשטרה בהספק של 3GW ובהשקעה של כ-21 מיליארד דולר. מהלך זה מצטרף לגל השקעות של ענקיות טכנולוגיה כמו מיקרוסופט, גוגל ואמזון במדינה, ומדגיש את החשיבות של פיתוח תשתיות פיזיות יציבות לצורך הפעלת מודלי שפה גדולים וסוכני AI בקנה מידה גלובלי.

AirTrunk Blackstone India

קרא עוד