פריצת הדרך של אמזון בתשתיות רשת ענן
אמזון (AWS) מדווחת על שינוי דרמטי בעיצוב רשתות תקשורת לחוות שרתים, המבוסס על מודל "אקראי למחצה" (Quasi-random). לפי הדיווח, הארכיטקטורה החדשה, המופעלת באמצעות רכיב חומרה ייעודי בשם ShuffleBox, חותכת את צריכת החשמל של הרשת ב-40%, מפחיתה את עלויות התפעול ב-27%, ומאיצה את תעבורת הנתונים ב-33%, ללא צורך בהגדלת תשתיות הפיזיות.
המאמר הנוכחי מבוסס על תחקיר מעמיק של לורן גוד אשר פורסם במגזין הטכנולוגיה WIRED. במרוץ החימוש הטכנולוגי של חברות הענק, תשומת הלב הציבורית מופנית לרוב למודלי שפה או לאפליקציות בינה מלאכותית מורכבות. עם זאת, המנוע האמיתי שמאפשר את כל אלו – תשתיות הענן הפיזיות וחוות השרתים – מתמודד עם אתגרי צוואר בקבוק הולכים וגדלים. כעת, חברת הענן הגדולה בעולם טוענת כי הצליחה לפתור בעיה הנדסית ומתמטית שהעסיקה חוקרים באקדמיה במשך עשרות שנים.
מה זה ארכיטקטורת רשת אקראית למחצה (RNG)?
ארכיטקטורת רשת אקראית למחצה, או במונח המקצועי שנטבע על ידי מהנדסי החברה, "גרפי רשת עמידים" (Resilient Network Graphs - RNG), היא תפיסה שונה לחלוטין של חיבור בין שרתים, מתגים ונתבים בחוות שרתים עצומות. בהקשר עסקי ותשתיתי, המטרה היא להעביר כמויות אדירות של נתונים מנקודה אחת לשנייה במינימום זמן והשהיה.
במקום להסתמך על מבנה היררכי קפדני ומסודר שבו נתונים עוברים במסלולים מוגדרים מראש, ארכיטקטורת RNG פועלת כרשת גמישה ושטוחה שבה חיבורים רבים נעשים באופן מתמטי אקראי. לדוגמה, במקום שכל שרת ייאלץ לשלוח את המידע שלו למתג מרכזי עמוס אחד, המידע "מדלג" בזמן אמת דרך מגוון עצום של נתיבים אלטרנטיביים קצרים יותר. לפי הדיווח, הארכיטקטורה מיושמת בפועל בעזרת רכיב חומרה חדש פרי פיתוחה של אמזון שזכה לשם ShuffleBox, אשר מנתב פיזית את הסיבים האופטיים ויוצר את אותה אקראיות מבוקרת.
המהפכה של אמזון: מ-Fat-Tree לכאוס מתוכנן
מאז שנות השמונים של המאה הקודמת, רשתות התקשורת בחוות השרתים נשענו כמעט בלעדית על טופולוגיה הידועה בשם "Fat-Tree" (עץ שמן). על פי הדיווח, טופולוגיה זו בנויה משכבות אנכיות של נתבים ומתגים, כאשר השכבות העליונות מקבלות פס רחב יותר כדי למנוע עומסים. למרות אמינותה, מדובר בשיטה נוקשה במיוחד הדורשת כמויות אדירות של כבילה פיזית. על מנת להבין את קנה המידה, חוות השרתים הגלובליות של אמזון מחוברות כיום בכ-20 מיליון קילומטרים של כבלי סיבים אופטיים.
כבר בשנת 2012, צוות חוקרים מאוניברסיטת אילינוי (University of Illinois Urbana-Champaign), ביניהם פרופ' ברייטן גודפרי, הציג מודל תיאורטי בשם "מדוזה" (Jellyfish). החוקרים טענו כי רשת אקראית תוכל להיות יעילה וגמישה בהרבה מהמודל המסורתי. עם זאת, יישום רשת אקראית בפועל בממדי ענק נחשב לבעיה כמעט בלתי פתירה בגלל הקושי בניווט המידע ובסידור הפיזי של הכבלים. גוגל (Google) ניסתה לפתור את הבעיה בדרכים משלה על ידי שילוב מערכות מיתוג אופטי (OCS) מבוססות מראות זעירות, אך גם כיוון זה דרש מורכבויות הנדסיות חסרות תקדים.
ההקשר הרחב: חומרה מתמטית ויעילות אנרגטית
המעבר של אמזון לגישת ה-RNG נשען על מחקר אינטנסיבי ששילב תיאוריות מתמטיות מהאקדמיה לתוך העולם העסקי. ג'אקומו ברנרדי, ממחברי המאמר המדעי שפרסמה אמזון בנושא בחודש האחרון, ציין כי הצוות ניסה תחילה לשאוב השראה מריצוף פנרוז (Penrose tiling) – דפוס גיאומטרי שאינו חוזר על עצמו. כשהסימולציות הראו שהרשת אינה אמינה מספיק למטרות החברה, החליטו ב-AWS "לאמץ את הכאוס" ולעבור לגישה מתמטית אקראית.
התוצאות של המהלך פורצות דרך. לפי הנתונים שפורסמו על ידי מאט רהדר, סגן נשיא להנדסת רשתות ב-AWS, התשתית החדשה מאפשרת לחברה להשתמש ב-69% פחות נתבים ומתגים לעומת רשתות מסורתיות מקבילות. המשמעות ברמת החומרה מובילה לקיצוץ חד של 40% בצריכת החשמל של הרשת, כל זאת תוך העלאת קצב תעבורת הנתונים ב-33%.
ההשלכות לעסקים בישראל ולסביבת הענן המקומית
למרות שהפיתוח של אמזון מתמקד בתשתיות פיזיות עמוקות הרחק מהעין הציבורית, יש לו השלכות רוחביות נרחבות על כלל צרכני מחשוב הענן. אקו-סיסטם ההייטק והעסקים בישראל נשען באופן כבד במיוחד על שירותי AWS, ואמזון אף מפעילה את אזור הענן המקומי שלה (AWS Israel Region) המשרת את הממשלה ואלפי ארגונים ישראליים.
כאשר ספקית הענן המובילה בעולם מצליחה לחתוך את עלויות התפעול של תשתיות הרשת שלה בלא פחות מ-27%, מדובר בבשורה כלכלית חשובה. קיצוץ עלויות ברמת התשתית מאפשר לאמזון לשמור על מחירי אחסון ועיבוד תחרותיים יותר לטווח הארוך, ולהציע יכולות רוחב פס עדיפות. עבור חברות תוכנה וסטארט-אפים ישראלים המנהלים מאגרי נתונים ומריצים מודלים חישוביים כבדים, רשת פנימית מהירה ב-33% יכולה לחתוך זמני השהיה (Latency) בשיעור ניכר ולשפר את חוויית הלקוח הסופי, מבלי להידרש לשדרוג חבילות רוחב פס. הטכנולוגיה הוטמעה כבר בחוות שרתים בדבלין, גרמניה וספרד, ותורחב בהדרגה לאזורים נוספים בעולם.
מה לעשות עכשיו
עבור סמנכ"לי טכנולוגיה (CTO) ומנהלי מחלקות מערכות מידע בישראל, מדובר בהתפתחות קריטית לתכנון מערכתי:
- תכנון עומסי שירות ויציבות: הירידה החדה בכמות הרכיבים הפיזיים בארכיטקטורת רשת (פחות מתגים) פירושה פחות נקודות כשל חומרתיות מצד ספקית הענן. מומלץ לבדוק אם רמת האמינות הגבוהה יותר באזורי ה-RNG מאפשרת להפחית יתירות (Redundancy) המוגדרת במערכות התוכנה שלכם.
- אופטימיזציה פיננסית לענן (FinOps): חידושים אלו של AWS מכתיבים סטנדרטים של עלות מול תועלת בשוק של מיקרוסופט (Azure) וגוגל. נצלו את המעבר לטכנולוגיות חסכוניות בדיוני תמחור של מופעי שרת (Instances).
- בחינה מחדש של צרכי רשת: לקוחות המריצים עומסי עבודה כבדים המבוססים על תקשורת נרחבת בין שרתים (כגון ארכיטקטורת Microservices) צריכים לעקוב אחר זמינות התשתית החדשה (RNG) באזורי הענן הספציפיים (Regions) שבהם החברה פועלת.
מבט קדימה
הנטישה של מודלים קשיחים לטובת רשתות דינמיות מדגישה כי טרנספורמציה דיגיטלית אמיתית מתרחשת פעמים רבות מתחת לפני השטח. בעוד שהשיח העולמי ממוקד בתוכנות בינה מלאכותית יוצרת, היכולת לדחוס יותר נתונים באמצעות אותם כבלים פיזיים, תוך צמצום דרמטי של עלויות החשמל, היא הבסיס להמשך הצמיחה של עסקים. בעלי עסקים נדרשים להמשיך ולעקוב אחר שינויי עומק אלו בתשתיות הענן, אשר מתורגמים ישירות לחיסכון וליתרון תחרותי.