זיהוי הלוצינציות ב-LLM עם Spilled Energy ללא אימון נוסף
**Spilled Energy הוא מדד חדש לזיהוי הלוצינציות במודלי שפה גדולים, המבוסס על logits בזמן יצירה ואינו דורש אימון נוסף.** לפי מחקר חדש ב-arXiv, המדד נבדק על 9 בנצ'מרקים ובמודלים כמו LLaMA, Mistral, Gemma ו-Qwen3, והראה יכולת תחרותית בזיהוי שגיאות עובדתיות והטיות. עבור עסקים בישראל, המשמעות היא אפשרות לבנות שכבת בקרה מעל עוזרי AI, מערכות WhatsApp ו-CRM, כך שתשובות בסיכון גבוה לא יישלחו אוטומטית. זה רלוונטי במיוחד למשרדי עורכי דין, מרפאות, ביטוח וחנויות אונליין שמחברים AI Agents, Zoho CRM, WhatsApp Business API ו-N8N לתהליכי שירות ומכירה.
קרא עוד