בעידן שבו מודלי שפה גדולים (LLMs) כובשים את עולם הבינה המלאכותית, אתגר מרכזי נותר בפענוח גרפים עם תכונות טקסט (TAGs). מחקרים קודמים הסתמכו על תיאור מילולי של מבנה הגרף באמצעות הנחיות מותאמות ידנית, תוך שימוש בדגימה אקראית של שכנים – גישה שמביאה רעש ומקשה על יציבות החשיבה. כעת, חוקרים מציגים את HS2C, מסגרת חדשנית לדחיסת מבנה וסמנטיקה מבוססת הומופיליה, שמנצלת את ההיגיון הטבעי של גרפים לשיפור דרמטי בביצועים.
המסגרת HS2C מתמקדת בניצול ההומופיליה – הנטייה של צמתים דומים להתחבר – כדי ליצור דחיסה איכותית. מבחינה מבנית, היא מבצעת חלוקה היררכית גלובלית מונחית עקרון מינימום אנטרופיית מבנה, שמזהה קהילות הומופיליות טבעיות ומשליכה חיבורים רעשניים אקראיים. כך נשמרת הטופולוגיה המהותית של הגרף בלי עודף מידע מזיק. לפי הדיווח, גישה זו מאפשרת דחיסה יעילה יותר מהשיטות הקיימות, תוך שמירה על מידע קריטי.
מבחינה סמנטית, HS2C מעבירה את ההומופיליה המבנית ל-LLM, שמבצע אגרגציה סמנטית מותאמת לפי סוגי קהילות מוגדרים מראש. תהליך זה דוחס הקשרי רקע מיותרים להסכמה ברמת קהילה, ומשמר רק מידע סמנטי הומופילי הרלוונטי לצומת היעד. התוצאה: קלט נקי וממוקד יותר למודל, שמפחית רעש ומשפר את יכולת החשיבה.
ניסויים מקיפים על 10 מדדי ביצועים ברמת צומת, על פני משפחות וגדלים שונים של LLMs, מראים כי HS2C משפרת את שיעור הדחיסה ואת הדיוק בשווה נוחות. בדיקות נוספות על 7 מדדי גרף מגוונים מחזקות את הכללייות של המסגרת. השיטה מצטיינת בקנה מידה ובגמישות, ומצביעה על פוטנציאל לשימושים רחבים יותר בעיבוד גרפים.
למנהלי עסקים ישראלים בתחום הטכנולוגיה, HS2C פותחת אופקים חדשים באוטומציה ובניתוח נתונים מבוססי גרף, כמו רשתות חברתיות או המלצות. היא מדגישה כיצד ניצול מאפייני גרפים טבעיים יכול לייעל יישומי AI, להפחית עלויות חישוב ולשפר החלטות עסקיות. האם הגיע הזמן לשלב הומופיליה באסטרטגיות ה-LLM שלכם?