Skip to main content
Automaziot AI logo
  • Home
  • Blog
  • About
  • Contact
(646) 760-4854Book a Free Consultation
Automaziot AI - AI Automation and Intelligent Agents for Business

AI Automation Experts. We help businesses streamline operations and scale faster with intelligent agents and workflow automation.

USA(646) 760-4854IL+972-3-7630715info@automaziot.ai
Ahad Ha'Am 9, Tel Aviv, Shalom Tower

Quick Links

  • Home
  • About
  • Contact
  • Case Studies
  • Glossary

Our Solutions

  • Lead Management
  • WhatsApp AI Agent
  • Business Automation
  • Smart CRM
  • Automated Scheduling
  • Sales & Support
  • WhatsApp Commerce
  • AI Agents
  • Tech Consulting

Stay Updated

Get the latest insights on AI automation delivered to your inbox.

FacebookInstagramLinkedIn

This site uses Google Analytics and Vercel Analytics to improve your experience. For full details, see our Privacy Policy

© 2026 Automaziot AI. All rights reserved.

Privacy PolicyTerms of ServiceAccessibilityEditorial Policy
Anthropic ורמאות Claude במבחן ראיונות
Anthropic מעדכנת מבחן ראיונות בגלל רמאות עם Claude
ביתחדשותAnthropic מעדכנת מבחן ראיונות בגלל רמאות עם Claude
חדשות

Anthropic מעדכנת מבחן ראיונות בגלל רמאות עם Claude

צוות הביצועים של החברה נאלץ לשנות את המבחן שוב ושוב, כיוון שמודלי Claude עולים על רוב המועמדים

אייל יעקבי מילראייל יעקבי מילר
22 בינואר 2026
2 דקות קריאה

תגיות

AnthropicClaudeTristan Hume

נושאים קשורים

#AI#ראיונות עבודה#Claude#רמאות AI#גיוס טכנולוגי

✨תקציר מנהלים

Key Takeaways

  • Anthropic מעדכנת מבחן ביתי למועמדים מאז 2024 בגלל התקדמות Claude.

  • Claude Opus 4 עלה על רוב האנשים, ו-4.5 תואם את הטובים ביותר.

  • החברה פיתחה מבחן חדש פחות מבוסס חומרה כדי להקשות על AI.

  • הפוסט מזמין הצעות לשיפור מהקהילה.

Anthropic מעדכנת מבחן ראיונות בגלל רמאות עם Claude

  • Anthropic מעדכנת מבחן ביתי למועמדים מאז 2024 בגלל התקדמות Claude.
  • Claude Opus 4 עלה על רוב האנשים, ו-4.5 תואם את הטובים ביותר.
  • החברה פיתחה מבחן חדש פחות מבוסס חומרה כדי להקשות על AI.
  • הפוסט מזמין הצעות לשיפור מהקהילה.

בעולם שבו AI הופך לכלי רמאות נפוץ, Anthropic נתקלת בבעיה ייחודית: המבחן הטכני שלה למועמדים לעבודה נכבש על ידי Claude, המודל שלה עצמה. מאז 2024, צוות אופטימיזציית הביצועים של החברה מחלק מבחן ביתי כדי לבדוק את כישורי המועמדים. אולם, עם התקדמות כלי קידוד מבוססי AI, המבחן נאלץ להשתנות באופן דרמטי כדי להישאר צעד אחד קדימה.

טריסטן היום, ראש הצוות, תיאר את ההיסטוריה של האתגר בפוסט בלוג שפרסם. "כל מודל Claude חדש הכריח אותנו לעצב מחדש את המבחן", הוא כותב. כשהוגבל לזמן זהה לזה של המועמדים, Claude Opus 4 עלה על רוב המועמדים האנושיים. זה עדיין אפשר להבחין בין המועמדים הטובים ביותר – אך אז הגיע Claude Opus 4.5, שתואם אפילו את הטובים שבהם.

התוצאה היא בעיית הערכת מועמדים חמורה. ללא פיקוח פנים אל פנים, אין דרך לוודא שמישהו לא משתמש ב-AI כדי לרמות במבחן – ואם כן, הוא יעלה במהירות לראש הרשימה. "תחת מגבלות המבחן הביתי, אין לנו עוד דרך להבחין בין הפלט של המועמדים הטובים ביותר שלנו לבין המודל המתקדם ביותר שלנו", כותב היום. הבעיה הזו כבר משתוללת בבתי ספר ואוניברסיטאות בעולם, אך אירוני שאותיות המעבדות AI נאלצות להתמודד איתה.

Anthropic, עם זאת, מצוידת היטב להתמודד עם האתגר. בסופו של דבר, היום תכנן מבחן חדש שקשור פחות לאופטימיזציה של חומרה, מה שהופך אותו לחדשני מספיק כדי להקשות על כלי AI עכשוויים. כחלק מהפוסט, הוא שיתף את המבחן המקורי כדי לראות אם קוראים יכולים להציע פתרון טוב יותר. "אם תוכלו לעלות על Opus 4.5", נכתב בפוסט, "נשמח לשמוע מכם".

הסיפור מדגיש את האתגר הגובר בתעשיית ה-AI: כיצד לבחון כישורים אנושיים בעידן שבו מכונות מצטיינות במשימות הטכניות? למנהלי משאבי אנוש בישראל, זהו תזכורת לבחון מחדש תהליכי גיוס, אולי עם דגש על יצירתיות וחשיבה ביקורתית ש-AI עדיין מתקשה בו. מה תעשו כדי להבטיח שהמועמדים שלכם אמיתיים?

שאלות ותשובות

FAQ

אהבתם את הכתבה?

הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל

Your information will only be used to contact you and deliver our services. For details, see our Privacy Policy and Terms of Service

עוד כתבות שיעניינו אותך

לכל הכתבות
6 ימים לכרטיסים הזולים ביותר ל-TechCrunch Disrupt 2026
חדשות
Feb 22, 2026
5 min

6 ימים לכרטיסים הזולים ביותר ל-TechCrunch Disrupt 2026

**כרטיסים מוקדמים ל-TechCrunch Disrupt 2026 חוסכים עד 2,500 ₪ ומביאים גישה ל-10,000 משתתפים, 300 סטארטאפים ודוברים כמו מארי בארה.** לעסקים ישראלים, זה הזדמן לרשתות AI שמשפרות אוטומציה ב-40%.

TechCrunchDisrupt 2026Startup Battlefield
Read more
מחירי כרטיסים מוזלים ל-TechCrunch Disrupt 2026: חסכו עד 680$
חדשות
Feb 21, 2026
5 min

מחירי כרטיסים מוזלים ל-TechCrunch Disrupt 2026: חסכו עד 680$

**TechCrunch Disrupt 2026 חוסך עד 680$ בכרטיסים עד 27 בפברואר.** אירוע עם 10,000 משתתפים ב-AI וסטארטאפים, אידיאלי לעסקים ישראלים שרוצים רשתות ומשקיעים. השתתפות תעזור להטמיע אוטומציות כמו N8N ו-Zoho CRM.

TechCrunchDisrupt 2026Startup Battlefield
Read more
מעקב שיחות ChatGPT: OpenAI שקלה לדווח למשטרה על יורה
חדשות
Feb 21, 2026
5 min

מעקב שיחות ChatGPT: OpenAI שקלה לדווח למשטרה על יורה

מעקב שיחות AI לעסקים ישראלים הוא תהליך זיהוי אוטומטי של תכנים חשודים בשיחות ChatGPT. OpenAI זיהתה שימושים כאלה אצל יורה פוטנציאלי אך לא דיווחה מיד. לעסקים ישראלים עם סוכני וואטסאפ, זה סיכון משפטי תחת חוק הגנת הפרטיות – הטמיעו ניטור דרך N8N ו-Zoho CRM עכשיו.

OpenAIChatGPTJesse Van Rootselaar
Read more
תחרות OpenAI-Anthropic: רגע מביך בפסגת AI בהודו
חדשות
Feb 21, 2026
5 min

תחרות OpenAI-Anthropic: רגע מביך בפסגת AI בהודו

תחרות OpenAI-Anthropic מדגישה חדשנות AI: אלטמן ואמודיי נמנעו מאחיזת ידיים בפסגת הודו. לעסקים ישראליים, זה אומר API זולים יותר ל-[סוכני AI](/services/ai-agents) ב-N8N ו-Zoho CRM, חיסכון של 20 שעות שבועיות.

OpenAISam AltmanAnthropic
Read more