A Ramp Labs apresenta uma nova solução para a partilha de memória entre múltiplos agentes, reduzindo o consumo de tokens em até 65%

GateNews

Notícias do Gate News, a 11 de abril, a empresa de infraestruturas de IA Ramp Labs publicou resultados de investigação «Latent Briefing», permitindo uma partilha eficiente de memória entre sistemas multiagente através da compressão direta da cache KV de grandes modelos. Isto faz uma grande redução do consumo de Tokens sem perda de exatidão. Nas arquiteturas multiagente mais comuns, o orquestrador (Orchestrator) decompõe tarefas e chama repetidamente modelos de trabalhadores (Worker). À medida que a cadeia de inferência se vai tornando mais longa, a quantidade de Tokens cresce de forma exponencial. A ideia central do Latent Briefing é, com o auxílio do mecanismo de atenção, identificar as partes verdadeiramente essenciais no contexto e eliminar informação redundante diretamente na camada de representação, em vez de depender de resumos de LLM que são lentos ou de pesquisas RAG com baixa estabilidade. Nos testes de referência do LongBench v2, o método teve um desempenho notável: o consumo de Tokens do modelo Worker diminuiu 65%, a mediana de Tokens poupados em documentos de comprimento médio (32k a 100k) atingiu 49%, a exatidão global melhorou cerca de 3 pontos percentuais face à linha de base e o tempo adicional para cada compressão foi apenas de cerca de 1,7 segundos, o que equivale a acelerar aproximadamente 20 vezes em relação ao algoritmo original. O experimento usou Claude Sonnet 4 como orquestrador e Qwen3-14B como modelo de trabalhador, cobrindo cenários de documentos variados, como artigos académicos, documentos jurídicos, romances e relatórios governamentais. O estudo também descobriu que o limiar de compressão ideal varia em função da dificuldade da tarefa e do comprimento do documento — para tarefas difíceis, é mais adequado uma compressão mais agressiva para filtrar ruído de inferência oportunista; para documentos longos, é mais apropriada uma compressão mais ligeira para preservar informação-chave dispersa.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Pesquisadores Implantam a Tecnologia DPN-LE para Editar Traços de Personalidade de IA, Alterando Apenas 0,5% dos Neurônios

De acordo com a BlockBeats, em 3 de maio, o pesquisador de IA Brian Roemmele divulgou que sua empresa Zero-Human implantou a tecnologia DPN-LE (Dual Personality Neuron Localization and Editing) para ajustar com precisão

GateNews3h atrás

Agente de IA Manfred forma empresa, prepara carteira de criptomoedas para começar a negociar até o fim de maio

O agente de IA Manfred criou sua própria empresa e obteve uma carteira de cripto e credenciais comerciais, incluindo a capacidade de contratar funcionários e fazer pagamentos. O agente está programado para começar a negociar cripto até o fim de

GateNews3h atrás

O CEO da Tether Propõe a Integração de WDK e QVAC para Suporte a Cartões de Agentes

De acordo com a Foresight News, o CEO da Tether, Paolo Ardoino, afirmou no X que a emissora de stablecoin talvez precise acelerar a integração entre WDK e QVAC para dar suporte à funcionalidade de Agent Cards.

GateNews6h atrás

Particle Network Lança Roadmap de Contas Universais, Lança o Universal Deposit SDK e Contas de Agentes de IA

De acordo com a ChainCatcher, a Particle Network lançou hoje a próxima fase do roadmap dos Universal Accounts, apresentando dois novos produtos nos próximos meses: Universal Deposit SDK, que permite aos desenvolvedores adicionar depósitos multi-chain com aproximadamente 10 linhas de código, e Universal Agent Accounts,

GateNews7h atrás

A OpenAI permite que assinaturas do ChatGPT funcionem na plataforma de agentes OpenClaw

De acordo com o CEO da OpenAI, Sam Altman, em 2 de maio, os usuários do ChatGPT agora podem fazer login na plataforma de agentes OpenClaw com suas contas do ChatGPT e usar diretamente suas assinaturas existentes do ChatGPT na plataforma.

GateNews9h atrás

O agente de IA Manfred forma empresa e se prepara para operar em criptomoedas até o fim de maio

O agente de IA Manfred estabeleceu sua própria empresa e obteve uma carteira de criptomoedas, além de credenciais para contratar funcionários, fazer pagamentos e conduzir negócios. O agente planeja começar a negociar criptomoedas até o fim de

GateNews9h atrás
Comentário
0/400
Sem comentários