מחקר
6 דקות
מ־arXiv cs.AI
אופטימיזציית קרנלי GPU עם K-Search: מהפכת הביצועים
**K-Search הוא מחקר שמציע דרך חדשה לאופטימיזציית קרנלי GPU באמצעות שילוב של תכנון מפורש ויצירת קוד, ולא רק ניסוי וטעייה של מודל שפה.** לפי המאמר, השיטה השיגה שיפור ממוצע של 2.10x ועד 14.3x בקרנלי MoE, ואף הגיעה ל-1030 מיקרו-שניות במשימת TriMul על NVIDIA H100. עבור עסקים בישראל, המשמעות אינה פיתוח CUDA פנימי אלא הפחתת עלויות inference, שיפור זמני תגובה, והבנה שתשתיות AI משפיעות ישירות על שירות, מכירות ורווחיות. מי שמחבר AI Agents, WhatsApp Business API, Zoho CRM ו-N8N צריך לעקוב לא רק אחרי המודל, אלא גם אחרי הביצועים של שכבת ההרצה.
קרא עוד