מחקר
6 דקות
מ־arXiv cs.AI
MoralityGym להערכת יישור מוסרי היררכי בסוכני החלטה: מה זה אומר לעסקים
**MoralityGym הוא Benchmark שמודד יישור מוסרי היררכי בסוכני קבלת החלטות, עם 98 דילמות אתיות כסביבות Gymnasium ומדד Morality Metric שמפריד בין הצלחת משימה לבין עמידה בנורמות.** לפי arXiv:2602.13372v1, גם שיטות Safe RL מציגות מגבלות כשהכללים סותרים ומדורגים. לעסקים בישראל זה רלוונטי במיוחד במערכות שירות ומכירה שמבצעות פעולות: WhatsApp Business API שמחובר ל-Zoho CRM דרך N8N יכול לסגור יותר פניות, אבל גם להפר כלל גבוה כמו פרטיות או הוגנות אם אין “שרשרת נורמות” מוגדרת. הצעד הפרקטי: להגדיר 10 החלטות רגישות, לקבוע להן היררכיית כללים (פרטיות/ציות מעל KPI), ולהוסיף לוגים והסלמה לנציג אנושי במקרים רגישים.
קרא עוד