מעבר לג'מיני 3 פרו: JiSi מנצחת עם LLMs פתוחים
מחקר

מעבר לג'מיני 3 פרו: JiSi מנצחת עם LLMs פתוחים

שיתוף פעולה קולקטיבי של דגמי שפה גדולים פתוחים מקדים את ג'מיני 3 פרו בעלויות נמוכות יותר – מחקר חדש חושף

3 דקות קריאה

תקציר מנהלים

נקודות עיקריות

  • JiSi פותרת צווארי בקבוק בשיתוף LLMs באמצעות ניתוב מעורב ובחירת מתאגרגים.

  • עם 10 מודלים פתוחים, JiSi עולה על ג'מיני 3 פרו בתשעה ביצועים.

  • אינטליגנציה קולקטיבית מציעה אלטרנטיבה להגדלה יקרה של מודלים בודדים.

  • חשוב לעסקים: חיסכון בעלויות תוך שיפור ביצועי AI.

מעבר לג'מיני 3 פרו: JiSi מנצחת עם LLMs פתוחים

  • JiSi פותרת צווארי בקבוק בשיתוף LLMs באמצעות ניתוב מעורב ובחירת מתאגרגים.
  • עם 10 מודלים פתוחים, JiSi עולה על ג'מיני 3 פרו בתשעה ביצועים.
  • אינטליגנציה קולקטיבית מציעה אלטרנטיבה להגדלה יקרה של מודלים בודדים.
  • חשוב לעסקים: חיסכון בעלויות תוך שיפור ביצועי AI.
האם ניתן להכות את דגמי השפה הגדולים המתקדמים ביותר בעולם באמצעות שיתוף כוחות של מודלים פתוחים? מחקר חדש שפורסם ב-arXiv מציג את מסגרת JiSi, שמאפשרת לדגמי שפה גדולים (LLMs) פתוחים לשתף פעולה ולהשיא את ביצועי ג'מיני 3 פרו, תוך חיסכון של 53% בעלויות. במקום להשקיע בהגדלת מודלים בודדים, החוקרים מדגישים את כוחה של אינטליגנציה קולקטיבית כדרך חדשה ל-AGI. המחקר מזהה שלושה צווארי בקבוק מרכזיים בשיטות קיימות לשיתוף LLMs: ראשית, נתבים ללא אימון מסתמכים רק על דמיון טקסטואלי, ומתעלמים מקושיית הבעיה. שנית, שיטות אגרגציה סטטיות אינן בוחרות את המתאגרג הטוב ביותר לכל משימה. שלישית, אין ניצול מלא של המשלימות בין ניתוב לאגרגציה. JiSi פותרת זאת באמצעות חידושים חדשניים שמשפרים את שיתוף הפעולה. החידוש הראשון הוא Query-Response Mixed Routing, שמשלב מידע סמנטי עם הערכת קושי. השני – Support-Set-based Aggregator Selection, שבוחרת מתאגרגים על סמך יכולת אגרגציה וידע תחומי. השלישי – Adaptive Routing-Aggregation Switch, שמחליף דינמית בין ניתוב לאגרגציה לפי הצורך. שילוב אלה משחרר את הפוטנציאל המלא של שיתוף LLMs. בניסויים מקיפים על תשעה בנצ'מרקים, JiSi עם עשרה LLMs פתוחים עלתה על ג'מיני 3 פרו בעלויות של 47% בלבד. זהו שיפור משמעותי על פני שיטות קיימות, ומצביע על כך שאינטליגנציה קולקטיבית יכולה להיות אלטרנטיבה יעילה להגדלה מונוליטית. עבור עסקים ישראליים, זה פותח אפשרויות לשילוב מודלים פתוחים במערכות AI מקומיות. המחקר מציע נתיב חדש ל-AGI דרך שיתוף פעולה של מודלים קיימים, במקום פיתוח עלותי של מודלים חדשים. מנהלי טכנולוגיה צריכים לשקול אסטרטגיות כאלה להוזלת עלויות AI. מה תהיה ההשפעה על שוק ה-AI?

שאלות ותשובות

שאלות נפוצות

אהבתם את הכתבה?

הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל

המידע שתמסור ישמש ליצירת קשר ומתן שירותים. למידע נוסף ראה מדיניות פרטיות ותנאי שימוש

עוד כתבות שיעניינו אותך

לכל הכתבות
פירוק מובנה להיגיון LLM: שילוב עם רשת סמנטית
מחקר
2 דקות

פירוק מובנה להיגיון LLM: שילוב עם רשת סמנטית

בעידן שבו החלטות משפטיות, רפואיות ומדעיות חייבות להיות ניתנות לביקורת, מחקר חדש מציג פירוק מובנה להיגיון LLM שמשלב גמישות עם ערבויות פורמליות. קראו עכשיו על התוצאות המעולות בשלושה תחומים! (112 מילים)

LLMsSWRLOWL 2
קרא עוד