מחקר
5 דקות
מ־arXiv cs.AI
בנצ'מרק LLM-WikiRace: אתגר תכנון ארוך טווח ב-LLMs
**בנצ'מרק LLM-WikiRace בודק תכנון ב-LLMs דרך ניווט ויקיפדיה.** Gemini-3 מצליח ב-23% ממשימות קשות בלבד. לעסקים ישראלים, זה אומר צורך דחוף בשילוב N8N עם AI Agents לניהול תהליכים מורכבים כמו לידים ב-WhatsApp ו-CRM.
קרא עוד