פרומורל-בנץ': איך עיצוב פרומפטים משפר בטיחות מוסרית ב-LLM
ProMoral-Bench (arXiv:2602.13274v1) הוא בנצ'מרק שמאפשר להשוות בצורה אחידה בין 11 אסטרטגיות פרומפטינג להשגת חשיבה מוסרית ובטיחות במודלי שפה, על בסיס סטים כמו ETHICS, Scruples ו-WildJailbreak, ובתוספת מבחן חוסן חדש ETHICS-Contrast. החוקרים מציעים מדד מאוחד בשם UMSS שמאזן בין דיוק מוסרי לבין עמידות לתוכן מזיק וג’יילברייק. לפי הממצאים, פרומפטים קומפקטיים עם דוגמאות few-shot עקביות מנצחים פרומפטים מרובי-שלבים: הם יציבים יותר תחת ניסוח מחדש, עמידים יותר לפריצות, וגם זולים יותר בטוקנים—נקודה קריטית למי שמפעיל שירות ב-WhatsApp Business API ומשלב נתונים מ-CRM כמו Zoho דרך N8N.