מה עומד מאחורי איסוף נתונים לאימון בינה מלאכותית פיזית?
סטארטאפ בשם Human Archive מגייס עובדי קבלן בהודו כדי לתעד משימות יומיומיות באמצעות מצלמות גוף וחיישנים, במטרה לייצר מאגרי נתונים ייחודיים לאימון רובוטים וסוכני AI. המיזם, שגייס לאחרונה 8.2 מיליון דולר, מנסה לפתור את אחד האתגרים הגדולים ביותר של תעשיית הבינה המלאכותית: המחסור בנתוני עבודה פיזית מהעולם האמיתי, תוך התמודדות עם שאלות מורכבות של פרטיות ותגמול עובדים.
מה זה נתונים אגוצנטריים (Egocentric Data)?
נתונים אגוצנטריים הם מידע הנאסף מנקודת המבט בגוף ראשון של המשתמש, לרוב באמצעות מצלמות לבישות, חיישני תנועה או כפפות מישוש (Tactile). בהקשר עסקי, נתונים אלה מאפשרים למערכות ממוחשבות "לראות" ו"לחוש" את העולם בדיוק כפי שעובד אנושי חווה אותו במהלך ביצוע משימות שגרתיות.
המידע הזה מספק קונטקסט עשיר שאי אפשר להפיק ממצלמות אבטחה נייחות או מטקסט. לדוגמה, כאשר טכנאי מתקן מכונה, מצלמת הראש והחיישנים מתעדים את זווית הראייה שלו, את עוצמת המגע הדרושה כדי לסובב בורג מסוים, ואת רצף הפעולות המדויק. המידע הזה חיוני במיוחד כאשר מנסים ללמד זרועות רובוטיות לבצע פעולות עדינות כמו קיפול כביסה, חיתוך ירקות או תיקון לוחות אלקטרוניים, הדורשות תיאום עין-יד מורכב. לפי הדיווח, Human Archive פרסה כבר למעלה מ-1,000 מערכות לבישות כאלו במספר מיקומים, מה שמדגיש את הביקוש הגובר למידע מסוג זה על ידי מעבדות מחקר טכנולוגיות ברחבי העולם.
המרוץ לאימון הדור הבא של הרובוטים
כדי להבין את הרקע למהלך, חשוב להכיר את ההתפוצצות של כלכלת החלטורה בהודו בשנים האחרונות. שוק משלוחי המזון צמח דרמטית כאשר חברות מובילות כמו Zomato ו-Swiggy הונפקו בבורסה. לצד זאת, חברות המציעות שירותים עד הבית, מניקיון ועד תחזוקה, צברו פופולריות עצומה. הרשת העצומה הזו של עובדים סיפקה כר פורה לאיסוף הנתונים ההמוני הנדרש ופותרת את בעיית משאבי האנוש של הפרויקט.
הסטארטאפ Human Archive, שהוקם על ידי ארבעה סטודנטים מסטנפורד וברקלי, הודיע על גיוס של 8.2 מיליון דולר בהובלת Wing Venture Capital ומשקיעים מחברות מובילות כמו OpenAI ו-Meta. על פי הנתונים שפורסמו, החברה משתפת פעולה עם סטארטאפים בתחומי שירותי הבית והמסעדות. במסגרת שיתוף הפעולה, עובדים מקבלים תוספת שכר עבור חבישת כובעים המצוידים במצלמות וחיישנים שאוספים נתוני פעולה בזמן אמת. המידע נמכר לאחר מכן למעבדות לפיתוח מודלים של בינה מלאכותית.
המהלך לא עבר ללא התנגדויות. לפי הדיווח, מספר חברות שירותי בית הודיות בולטות, ביניהן Urban Company ו-Pronto, דחו את הצעות שיתוף הפעולה של הסטארטאפ. מנכ"ל Urban Company אף הצהיר פומבית כי חברתו לא תיקח חלק בהסדרים מסוג זה. למרות זאת, Human Archive בחרה לחבור לסטארטאפים קטנים יותר, המאפשרים ללקוחות לקבל שירות במחיר מוזל בתמורה להסכמתם לתיעוד הפעילות בביתם.
בניגוד למיזמים אחרים המסתמכים על וידאו בלבד, היתרון של החברה טמון בשילוב של ציוד מגוון. המערכות כוללות כפפות לאיסוף נתוני מישוש, חליפות לכידת תנועה מלאות ומצלמות שורש כף יד. החברה מתמודדת גם עם ביקורת; נטען כי מתחרים משלמים לעובדים עד 4.20 דולר לשעה, בעוד החברה מציעה שכר בסיס של דולר אחד בלבד. עם זאת, הסטארטאפ טוען כי הפעילות מייצרת מקור הכנסה לעובדי קבלן, בזמן שמעבדות ברחבי העולם צמאות לאוטומציה עסקית מתקדמת.
ההקשר הרחב: צוואר הבקבוק של תעשיית ה-AI
תעשיית הבינה המלאכותית מתמודדת כיום עם צוואר בקבוק משמעותי בפיתוח מודלים המסוגלים לבצע פעולות פיזיות. בעוד שסוכני AI לעסקים ומודלי שפה התקדמו בצעדי ענק בזכות טקסטים מהאינטרנט, המעבר לעולם הפיזי דורש נתונים שונים לחלוטין. לפי זאק דה-ויט, שותף בקרן Wing VC, שום גוף אחר בעולם עדיין לא הצליח לסנכרן ולאסוף נתוני מישוש ווידאו בהיקף כזה, מה שהופך את המאגרים הללו למידע הכרחי עבור מעבדות המנסות לפתח פתרונות רובוטיקה מסחריים.
ההשלכות לעסקים בישראל
מהפרספקטיבה של עסקים ישראליים, המגמה הזו משליכה על שני מגזרים מרכזיים: חברות דיפ-טק וחברות טכנולוגיה חקלאית (AgriTech) הנדרשות לאמן מודלים עבור רובוטיקה, ועסקים קונבנציונליים המספקים שירותים פיזיים, כמו הנדסה, קליניקות וחברות ניקיון שיבקשו לייעל תהליכים בעתיד.
בישראל, איסוף נתוני עובדים ולקוחות כפוף לחוק הגנת הפרטיות. כל ניסיון לנטר עובדים מחייב הסכמה מפורשת ומידתית, והשימוש במידע מוגבל למטרה שלשמה נאסף. בניגוד למתואר בהודו, עסק ישראלי שיטמיע טכנולוגיות צילום יצטרך לבסס תשתית משפטית איתנה ושקיפות מלאה מול כל המעורבים. יתרה מכך, חברות ישראליות הפונות לשווקים בינלאומיים חייבות ליישם מנגנוני ניהול הסכמות, מחיקת נתונים וטשטוש פנים כפי שמבצעת Human Archive, כדי לעמוד בדרישות תקנות ה-GDPR המחמירות.
מה לעשות עכשיו
עבור בעלי עסקים הבוחנים שימוש בנתונים לשיפור וייעול תהליכים, אלו הצעדים המרכזיים:
- מיפוי תהליכים לפני חומרה: בדקו אילו משימות חוזרות ניתן למחשב כבר היום. חיבור פשוט של ערוצי תקשורת כמו WhatsApp Business API למערכת ניהול לקוחות (CRM) חכמה, יחסוך שעות עבודה שבועיות ללא צורך בהטמעת חומרה יקרה.
- ניהול הסכמות דיגיטלי נכון: אם קיימת דרישה לאיסוף צילומי לקוחות לבקרת איכות, השתמשו בטפסים דיגיטליים מאובטחים דרך מערכת Zoho CRM. הגדירו תהליך אוטומטי בו לקוח מאשר תנאי שימוש לפני הגעת הצוות לשטח.
- ניצול מידע טקסטואלי וקולי: במקום לאסוף נתוני וידאו שדורשים נפח אחסון ועיבוד יקרים, החלו בעיבוד נתונים קיימים. כלים כמו N8N מאפשרים לעבד שיחות ולתייג מידע תפעולי באופן כמעט מיידי.
- הסדרה משפטית מראש: ודאו כי מנגנוני התיעוד שברשותכם תואמים את חוק הגנת הפרטיות הישראלי, תוך יצירת מסמכי מדיניות ברורים מול צוות העובדים.
מבט קדימה
איסוף נתונים פיזיים לאימון מודלים מהווה קפיצת מדרגה ביכולתנו לפתח מערכות המסוגלות לפעול בעולם האמיתי במדויק. החברות הגדולות בעולם משקיעות מיליארדי דולרים בפיתוח תשתיות אלו, והבשורה צפויה להגיע בהמשך גם לתוכנות המדף הארגוניות. בעוד שחזון הרובוטיקה מתעצב בהודו ובעמק הסיליקון, עסקים בישראל צריכים להבין שניהול חכם של מידע מכל סוג הוא בסיס ליתרון תחרותי מהותי, וחשוב להיערך לכך בצורה מסודרת וחוקית.