בעולם שבו פיתוח תוכנה הופך לאוטומטי יותר ויותר, חברת Mistral AI הצרפתי משיקה את Devstral 2 – מודל קידוד פתוח במשקל 123 מיליארד פרמטרים, המיועד לשמש כחלק מסוכן הנדסת תוכנה אוטונומי. המודל משיג ציון מרשים של 72.2% בבנצ'מרק SWE-bench Verified, שמבחן יכולת פתרון בעיות אמיתיות מ-GitHub, וממקם אותו בין המודלים הפתוחים הטובים ביותר.
ההשקה כוללת לא רק את המודל עצמו, אלא גם אפליקציית פיתוח חדשה בשם Mistral Vibe. זהו ממשק שורת פקודה (CLI) דמוי Claude Code או OpenAI Codex, המאפשר למפתחים להתממשק ישירות עם מודלי Devstral בטרמינל. הכלי סורק מבנה קבצים ומצב Git, שומר על הקשר לאורך הפרויקט כולו, מבצע שינויים בקבצים מרובים ומבצע פקודות שורת פקודה באופן אוטונומי. Mistral שחררה את ה-CLI תחת רישיון Apache 2.0.
בנצ'מרק SWE-bench Verified כולל 500 בעיות הנדסת תוכנה אמיתיות מ-GitHub, ממאגרי Python פופולריים. המערכת צריכה לקרוא את תיאור הבעיה, לנווט בקודבס, וליצור תיקון שעובר בדיקות יחידה. עובדי חברות AI גדולות מדווחים שהם עוקבים מקרוב אחר הביצועים כאן, אם כי חוקרים מציינים ש-90% מהמשימות הן תיקוני באגים פשוטים שמהנדס מנוסה פותר בשעה.
ההשקה הזו מצמצמת את הפער בין מודלים פתוחים לסגורים, ומציעה למפתחים ישראלים כלי חופשי וחזק לשיפור זרימת העבודה. בעוד מודלים סגורים כמו GPT-4 דורשים מנויים יקרים, Devstral 2 זמין לכולם ומתאים לפרויקטים בקנה מידה גדול.
למנהלי טכנולוגיה בישראל, זה אומר הזדמנות לבחון אוטומציה בפיתוח ללא תלות בספקים גדולים. האם Devstral 2 יאיץ את אימוץ AI בקרב סטארט-אפים ישראליים? קראו והחליטו בעצמכם.