Skip to main content
Automaziot AI logo
  • Home
  • Blog
  • About
  • Contact
(646) 760-4854Book a Free Consultation
Automaziot AI - AI Automation and Intelligent Agents for Business

AI Automation Experts. We help businesses streamline operations and scale faster with intelligent agents and workflow automation.

USA(646) 760-4854Israel HQ+972-3-7630715info@automaziot.ai
Israel HQ: Ahad Ha'Am 9, Tel Aviv

Quick Links

  • Home
  • About
  • Contact
  • Case Studies
  • Glossary

Our Solutions

  • Lead Management
  • WhatsApp AI Agent
  • Business Automation
  • Smart CRM
  • Automated Scheduling
  • Sales & Support
  • WhatsApp Commerce
  • AI Agents
  • Tech Consulting

Stay Updated

Get the latest insights on AI automation delivered to your inbox.

FacebookInstagramLinkedIn

This site uses Google Analytics and Vercel Analytics to improve your experience. For full details, see our Privacy Policy

© 2026 Automaziot AI. All rights reserved.

Privacy PolicyTerms of ServiceAccessibilityEditorial Policy
מסגרת גוגל חדשה לניהול תקציב בכלי AI
גוגל חושפת מסגרת חדשה: סוכני AI מנהלים תקציבי כלים ביעילות
ביתחדשותגוגל חושפת מסגרת חדשה: סוכני AI מנהלים תקציבי כלים ביעילות
מחקר

גוגל חושפת מסגרת חדשה: סוכני AI מנהלים תקציבי כלים ביעילות

חוקרים מגוגל ו-U.C. סנטה ברברה פיתחו Budget Tracker ו-BATS – טכניקות שמאפשרות לסוכנים לחסוך עד 40% בשימוש בכלים ולשפר ביצועים

צוות אוטומציות AIצוות אוטומציות AI
13 בדצמבר 2025
4 דקות קריאה

תגיות

GoogleUC Santa BarbaraGemini 2.5 ProReActBrowseCompZifeng WangTengxiao Liu

נושאים קשורים

#סוכני AI#למידת מכונה#אופטימיזציה#סקיילינג AI#כלי חיפוש
מבוסס על כתבה שלVentureBeat ↗·תרגום, סיכום והקשר עסקי על-ידי המערכתאיך אנחנו עובדים

✨תקציר מנהלים

Key Takeaways

  • Budget Tracker מפחית 40% קריאות חיפוש ו-31% עלויות כוללות

  • BATS משיגה 24.6% דיוק ב-BrowseComp לעומת 12.6% ב-ReAct

  • הטכניקות מאפשרות אפליקציות ארגוניות ארוכות טווח כמו ביקורות ציות

  • סקיילינג מודע תקציב הופך סוכני AI לכדאיים כלכלית

גוגל חושפת מסגרת חדשה: סוכני AI מנהלים תקציבי כלים ביעילות

  • Budget Tracker מפחית 40% קריאות חיפוש ו-31% עלויות כוללות
  • BATS משיגה 24.6% דיוק ב-BrowseComp לעומת 12.6% ב-ReAct
  • הטכניקות מאפשרות אפליקציות ארגוניות ארוכות טווח כמו ביקורות ציות
  • סקיילינג מודע תקציב הופך סוכני AI לכדאיים כלכלית

בעידן שבו כל קריאת כלי AI עולה כסף וזמן, חוקרים מגוגל ומאוניברסיטת קליפורניה בסנטה ברברה מציגים מסגרת חדשה שמאפשרת לסוכני מודלי שפה גדולים (LLM) לנהל את תקציבי המחשוב והכלים שלהם ביעילות. המחקר, שפורסם לאחרונה, מציג שתי טכניקות מרכזיות: Budget Tracker הפשוט ו-BATS המקיף – Budget Aware Test-time Scaling. הטכניקות הללו הופכות את הסוכנים למודעים לתקציב הנותר שלהם, ומבטיחות שימוש חכם יותר במשאבים. עבור מנהלי ארגונים ישראלים, זהו צעד קריטי להטמעת סוכני AI ללא עלויות בלתי צפויות.

האתגר המרכזי בשימוש בכלים בסוכני AI הוא ניהול התקציב. סקיילינג בזמן מבחן מסורתי מתמקד בהארכת חשיבה, אך במשימות כמו גלישה באינטרנט, מספר קריאות הכלים קובע את עומק החקירה. 'קריאות כלים כמו תוצאות גלישה מגדילות צריכת טוקנים, מאריכות את ההקשר ומעלות השהיות ולעלויות API נוספות', אמרו זייפנג וואנג וטנגשיאו לו, שותפים למחקר, ל-VentureBeat. ללא מודעות תקציב, סוכנים מבזבזים משאבים על נתיבים ללא מוצא, כמו חקירת רמז לא רלוונטי במשך 10-20 קריאות.

כדי לפתור זאת, החוקרים פיתחו את Budget Tracker – מודול קל משקל הפועל ברמת הפרומפט. הוא מספק לסוכן אות תמידי על זמינות המשאבים, ומאפשר לו להתאים אסטרטגיה ללא אימון נוסף. ביישום של גוגל, המעקב מספק הנחיות מדיניות לתקציבים שונים ומעדכן צריכה בכל שלב. נבדקו פרדיגמות סקיילינג רציף ומקבילי על סוכני חיפוש עם כלי חיפוש וגלישה בסגנון ReAct. התוצאות: Budget Tracker משפר ביצועים בכל תקציב, עם 40.4% פחות קריאות חיפוש, 19.9% פחות גלישה וחיסכון כולל של 31.3% בעלויות, בהשוואה ל-ReAct רגיל.

מעבר לכך, BATS – Budget Aware Test-time Scaling – מסגרת מקיפה שמקסימיזית ביצועים בכל תקציב נתון. היא כוללת מודול תכנון שמתאים מאמץ צעד אחר צעד, ומודול אימות שמחליט אם להעמיק או לעבור נתיבים חלופיים. בתהליך, BATS בונה תוכנית פעולה, מוסיף תוצאות כלים להקשר, מאמת תשובות ומסיים ב-LLM ששופט את הטובה ביותר. נבדק על BrowseComp, BrowseComp-ZH ו-HLE-Search עם Gemini 2.5 Pro ו-Claude Sonnet 4. BATS השיגה 24.6% דיוק ב-BrowseComp לעומת 12.6% ב-ReAct, ו-27% ב-HLE-Search לעומת 20.5%.

הטכניקות הללו משנות את כללי המשחק בהשוואה למתחרים. בעוד ReAct מגיע לפלטו, Budget Tracker ו-BATS ממשיכים לשפר עם תקציב גדול יותר. בהשוואת עלויות, BATS משיגה דיוק גבוה בעלות של כ-23 סנט, לעומת 50 סנט בשיטות מקביליות. זה רלוונטי במיוחד לישראל, שבה חברות כמו וויקס ומובילאיי משלבות סוכני AI בפיתוח, ומחפשות אופטימיזציה לעלויות ענן גבוהות.

למנהלי עסקים, המסגרת פותחת אפליקציות ארוכות טווח כמו תחזוקת קוד מורכבת, בדיקות נאותות, מחקר תחרותי וביקורות ציות. 'זה הופך זרימות עבודה יקרות לכדאיות', אומרים החוקרים. הסוכנים לומדים לאזן דיוק ועלות, מה שיהפוך לדרישה עיצובית קריטית.

בעתיד, קשר בין חשיבה לכלכלה יהיה בלתי נפרד. 'מודלים חייבים לחשוב על ערך', אומרים וואנג וליו. מנהלים ישראלים צריכים לשקול אינטגרציה של BATS בפיתוחים הבאים.

מה תקציב הכלים שלכם לסוכני AI? האם הגיע הזמן לאמץ ניהול תקציב חכם?

שאלות ותשובות

FAQ

הכתבה הוכנה על-ידי המערכת בליווי בינה מלאכותית: תרגום, סיכום והוספת הקשר עסקי ישראלי מתוך פרסום מקורי של VentureBeat. קראו על תהליך העריכה שלנו. קישור למקור המקורי.

אהבתם את הכתבה?

הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל

Your information will only be used to contact you and deliver our services. For details, see ourPrivacy Policy and Terms of Service

עוד מ־VentureBeat

כל הכתבות מ־VentureBeat
Railway גייסה 100 מיליון דולר לאתגר את AWS בתשתית ענן AI
חדשות
22 בינואר 2026
4 דקות
·מ־VentureBeat

Railway גייסה 100 מיליון דולר לאתגר את AWS בתשתית ענן AI

Railway גייסה 100 מיליון דולר לפלטפורמת ענן AI מהירה שמאתגרת את AWS. פריסות בשנייה, חיסכון 65% ו-2 מיליון משתמשים. קראו עכשיו על המהפכה!

RailwayJake CooperTQ Ventures
קרא עוד
Listen Labs גייסה 69 מיליון דולר אחרי קמפיין שילוט ויראלי
חדשות
16 בינואר 2026
4 דקות
·מ־VentureBeat

Listen Labs גייסה 69 מיליון דולר אחרי קמפיין שילוט ויראלי

אלפרד וולפורס מ-Listen Labs השתמש בלוח מודעות ויראלי כדי לגייס כישרונות, וכעת החברה גייסה 69 מיליון דולר. הפלטפורמה מבצעת ראיונות לקוחות AI מהירים ומדויקים, פותרת בעיות הונאה ומשמשת מיקרוסופט ועוד. קראו עכשיו על השינוי במחקר שוק!

Listen LabsAlfred WahlforssRibbit Capital
קרא עוד
סיילספורס משיקה סלאקבוט חדש: סוכן AI עוצמתי לעבודה
מוצר חדש
13 בינואר 2026
4 דקות
·מ־VentureBeat

סיילספורס משיקה סלאקבוט חדש: סוכן AI עוצמתי לעבודה

סיילספורס השיקה סלאקבוט חדש כסוכן AI שמשנה את חוקי המשחק בעבודה. הוא מחפש נתונים, כותב מסמכים ומבצע פעולות – זמין ללא עלות נוספת. קראו עכשיו על הביצועים המרשימים בבדיקות.

SalesforceSlackSlackbot
קרא עוד
אנטרופיק משיקה Cowork: סוכן AI לשולחן העבודה ללא קוד
מוצר חדש
13 בינואר 2026
4 דקות
·מ־VentureBeat

אנטרופיק משיקה Cowork: סוכן AI לשולחן העבודה ללא קוד

אנטרופיק משיקה Cowork, סוכן AI חדש שמאפשר למשתמשים רגילים לבצע משימות על קבצים במחשב ללא קוד. הכלי נבנה תוך שבועיים בעזרת Claude Code ומבטיח פרודוקטיביות גבוהה יותר. קראו את המאמר המלא עכשיו!

AnthropicClaudeCowork
קרא עוד

עוד כתבות שיעניינו אותך

לכל הכתבות
אבטחת מידע ברשתות סוכני AI: סכנות חדשות בעבודה אוטונומית
מחקר
לפני 9 שעות
5 דקות
·מ־Microsoft Research

אבטחת מידע ברשתות סוכני AI: סכנות חדשות בעבודה אוטונומית

מחקר מקיף של צוות האבטחה במיקרוסופט מצא כי כאשר סוכני בינה מלאכותית מתקשרים זה עם זה ברשתות משותפות, נוצרים סיכוני אבטחה חמורים שאינם קיימים בעבודה עם סוכן מבודד. בין היתר, הוכח בניסוי מבוקר כי הודעה זדונית בודדת יכולה ליצור התפשטות של "תולעת AI" המעתיקה נתונים אישיים מ-6 סוכנים שונים ללא מגע אדם, תוך ניצול של למעלה מ-100 קריאות API ולולאות תקשורת שחוסמות את פעילות המערכת. הדו"ח מזהיר חברות המסתמכות על אוטומציה ותשתיות סוכנים, במיוחד בניהול רשומות רפואיות ופיננסיות רגישות, להיערך לוקטורי תקיפה חדשים של הונאת סוכנים, הנדסה חברתית בין מודלי שפה, ומניפולציות מוניטין פנימיות שעלולות לעקוף את בקרות האבטחה האנושיות.

GPT-4ChatGPTCopilot
קרא עוד
הסייע הרפואי של Google DeepMind: מערכות בינה מלאכותית למרפאות פרטיות בישראל
מחקר
לפני 17 שעות
4 דקות
·מ־DeepMind

הסייע הרפואי של Google DeepMind: מערכות בינה מלאכותית למרפאות פרטיות בישראל

Google DeepMind חשפה את פרויקט "AI co-clinician", סוכן בינה מלאכותית מתקדם המיועד לעבוד בשיתוף פעולה לצד רופאים במרפאות ובסביבות טלמדיסין. בניגוד למערכות המבוססות על טקסט בלבד, המערכת החדשה פועלת על גבי מודלים מולטימודאליים המאפשרים לה לראות, לשמוע ולתקשר עם מטופלים בזמן אמת. במחקרי סימולציה מקיפים שכללו בדיקה של 140 מדדים קליניים, המערכת הציגה ביצועים ברמה המקבילה לרופאי משפחה ב-68 מהמדדים, ואף הצליחה להדריך מטופלים מרחוק בבדיקות פיזיות כמו שימוש נכון במשאף ואיתור פגיעות כתף. בעוד שהטכנולוגיה נמצאת עדיין בשלבי מחקר עולמי, היא מסמנת את הכיוון הברור אליו צועד ענף הרפואה: צמצום העומסים הקריטיים על הצוותים והכפלת יכולות הטיפול באמצעות סייעים דיגיטליים אמינים.

Google DeepMindWorld Health OrganizationMedPaLM
קרא עוד
ספקולטיב דיקודינג במובייל: למה AHASD משנה את המשחק
מחקר
אתמול
6 דקות
·מ־arXiv cs.AI

ספקולטיב דיקודינג במובייל: למה AHASD משנה את המשחק

**ספקולטיב דיקודינג במובייל הוא דרך להאיץ הרצת מודלי שפה גדולים על מכשירי קצה באמצעות מודל קטן שמכין טיוטה ומודל גדול שמאמת אותה.** במחקר AHASD שפורסם ב-arXiv החוקרים מדווחים על עד פי 4.2 בתפוקה ופי 5.6 ביעילות אנרגטית לעומת בסיס GPU בלבד, עם תקורת חומרה של פחות מ-3% משטח ה-DRAM. עבור עסקים בישראל, המשמעות היא אפשרות עתידית להעביר חלק ממשימות ה-AI למובייל — למשל סיכום שיחות, סיווג פניות והשלמת טפסים — תוך שילוב עם Zoho CRM, ‏WhatsApp Business API ו-N8N. זה עדיין לא מוצר מדף, אבל הכיוון חשוב מאוד לכל ארגון שבונה תהליכי AI מהירים, חסכוניים ורגישים לפרטיות.

Draft Language ModelTarget Language ModelNPU
קרא עוד
Auto-ARGUE להערכת דוחות RAG: למה זה חשוב לעסקים
מחקר
אתמול
5 דקות
·מ־arXiv cs.AI

Auto-ARGUE להערכת דוחות RAG: למה זה חשוב לעסקים

**Auto-ARGUE הוא כלי להערכת דוחות RAG עם ציטוטים, שנועד לבדוק אם מסמך שנוצר בידי מודל שפה אכן נשען על מקורות נכונים וניתנים לאימות.** לפי התקציר ב-arXiv, החוקרים בחנו אותו על משימות TREC 2024 ומצאו מתאם טוב ברמת המערכת מול שיפוט אנושי. עבור עסקים בישראל, המשמעות ברורה: אם אתם מייצרים סיכומי לידים, תקצירי תיקים, דוחות שירות או מסמכי הנהלה באמצעות מודלי שפה, אתם צריכים שכבת בקרה ולא רק שכבת יצירה. השילוב בין AI Agents,‏ WhatsApp Business API,‏ Zoho CRM ו-N8N יכול לספק תהליך עבודה חזק, אבל בלי מדידת איכות לדוחות עצמם, הסיכון לטעויות עסקיות נשאר גבוה.

TREC 2024NeuCLIRRAG
קרא עוד