Ramp Labs пропонує нове рішення для спільного використання пам’яті між багатьма агентами, витрати токенів знижуються максимум на 65%

GateNews

Оновлення Gate News: 11 квітня компанія з інфраструктури для AI Ramp Labs опублікувала результати дослідження «Latent Briefing». Вона забезпечує ефективний обмін пам’яттю між багатосистемними агентами шляхом прямого стиснення KV-кешу великих мовних моделей, значно зменшуючи витрати на Token без втрати точності. У більшості поширених архітектур багатосистемних агентів оркестратор (Orchestrator) розкладає завдання на частини та неодноразово викликає модель робітника (Worker). У міру того, як ланцюжок міркувань постійно подовжується, обсяг Token стрімко зростає експоненційно. Ключова ідея Latent Briefing полягає в тому, щоб за допомогою механізму уваги визначити в контексті справді важливі фрагменти, а в шарі представлення прямо відкидати надлишкову інформацію, а не покладатися на повільні LLM-зведення або ненадійний RAG-пошук. У бенчмарку LongBench v2 цей підхід показав вражаючі результати: витрати Token у моделі Worker знизилися на 65%, а медіанна економія Token для документів середньої довжини (32k до 100k) досягла 49%. Загальна точність підвищилася приблизно на 3 відсоткові пункти порівняно з базовим рівнем, тоді як додатковий час на кожне стиснення становить лише близько 1,7 секунди, що прискорює роботу приблизно у 20 разів порівняно з початковим алгоритмом. Експерименти проводилися з Claude Sonnet 4 як оркестратором і Qwen3-14B як моделлю робітника, охоплюючи сценарії з документами різних типів, зокрема наукові статті, юридичні документи, романи та урядові звіти. Дослідження також виявило, що оптимальний поріг стиснення залежить від складності завдання та довжини документа: для складних задач підходить більш агресивне стиснення, щоб відфільтрувати шум спекулятивного міркування, а для довгих документів краще підходить м’яке стиснення, щоб зберегти розосереджену ключову інформацію.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Visa запускає програму Agentic Ready у Гонконзі 1 травня, що дає змогу платити через AI-агенти

Згідно з матеріалами гонконгського видання Ming Pao, Visa запустила програму Visa Agentic Ready у Гонконзі 1 травня, що дає змогу здійснювати платежі за допомогою AI-агентів. У межах програми використовується токенізація, перевірка ідентичності, механізми управління ризиками та авторизації. Серед перших учасників —

GateNews2год тому

OpenClaw випускає v2026.4.29 29 квітня та оновлює пам’ять до персоналізованої вікі з відстеженням зв’язків

За даними Beating, відкритий AI-допоміжник OpenClaw (GitHub 367 тис. зірок) випустив v2026.4.29 29 квітня, що стало другим оновленням за два дні. Система пам’яті еволюціонувала від простого відтворення на основі запиту до персоналізованої wiki, дозволяючи агентам автоматично створювати профілі персонажів і відстежувати r

GateNews12год тому

Генеральний директор Google Пічаї розкрив, що за допомогою Gemini AI він прагне осягнути людську природу та вибудувати більш щирі комунікації

Пічай заявив, що перед важливими зустрічами він, спираючись на підхід Gemini, аналізує ймовірні думки співрозмовника, щоб підвищити рівень емпатії та вести більш щире спілкування. Також AI-агенти можуть автоматично впорядковувати листи, планувати розклад і створювати підсумки, роблячи щоденні дрібниці ефективнішими. Окрім того, зростає кількість AI-платформ, побудованих на відкритій співтворчості: такі відкриті технології, як Gemini 4, знижують поріг входу. Водночас наголошується на необхідності створення рамок AI-управління, і що владі та суспільству слід долучитися, щоб вирішувати виклики на кшталт кібербезпеки, deepfake та сталого розвитку.

ChainNewsAbmedia15год тому

Oobit у четвер запустить картки AI-агентів із підтримкою Visa, що дасть змогу витрачати USDT без конвертації в фіат

За даними The Block, стартап із гаманцями, що підтримуються Tether, Oobit у четвер запустив AI Agent Cards, що дають змогу автономним ботам здійснювати покупки, використовуючи залишки USDT, без конвертації у фіат і без прямого доступу до корпоративних облікових даних платіжних карток. Підтримувані Visa картки можна використовувати онлайн всюди, де доступна Visa.

GateNews15год тому

ChimpX AI залучив 2,8 млн доларів у посівному раунді, який очолили Waterdrip Capital і MetaLabs Ventures

ChimpX AI сьогодні оголосила про закриття seed-раунду на $2,8 мільйона для прискорення розробки Mojo AI — агента виконання, який перетворює наміри у звичайній англійській мові на on-chain DeFi-транзакції в Solana. Раунд очолив Waterdrip

GateNews17год тому

Крупна CEX запускає протокол агентських платежів 29 квітня, даючи змогу здійснювати міжланцюгові транзакції під керуванням ШІ

Згідно з недавнім повідомленням, провідна криптовалютна біржа представила протокол Agent Payments Protocol 29 квітня — відкритий стандарт, який дає змогу агентам штучного інтелекту виконувати повні бізнес-транзакції на кількох блокчейн-мережах без участі людини. Протокол

GateNews17год тому
Прокоментувати
0/400
Немає коментарів