A Análise Artificial lança um benchmark de agentes de codificação; Zhipu GLM-5.1 fica em primeiro lugar entre os modelos de código aberto

A Artificial Analysis lançou hoje um novo Coding Agent Index para avaliar o desempenho dos modelos de IA quando combinados com frameworks de agentes em benchmarks-chave, incluindo SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 e SWE-Atlas-QnA. A Zhipu GLM-5.1 ficou em primeiro lugar entre os modelos open-source na avaliação, demonstrando um desempenho de ponta em cenários reais de agentes de programação.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

A TT Chain integra o sistema de segurança AegisAI para proteção de RWA em 11 de maio

De acordo com o anúncio da TT Chain de 11 de maio, a rede blockchain de camada 2 integrou a infraestrutura de segurança orientada por IA da AegisAI no seu ecossistema de ativos do mundo real. A colaboração reforça a proteção para transações de ativos tokenizados e operações entre cadeias, através de capacidades avançadas de deteção de ameaças e auditoria de contratos inteligentes. Os agentes autónomos de IA da AegisAI detetam ataques de phishing, impedem tentativas de acesso não autorizado e ide

GateNews6h atrás

JD.com atualiza agente de IA desenvolvido internamente, crescimento da base de utilizadores excede 300% no 1.º trimestre

De acordo com o CEO Xu Ran, na conferência de resultados da JD.com de 12 de maio, a empresa está a atualizar de forma abrangente o seu agente de IA desenvolvido internamente para identificar, ativar e corresponder com maior precisão às necessidades dos utilizadores. O assistente de IA da JD.com, Jingdong Jingyan, registou um aumento de utilização dos utilizadores superior a 300% em termos homólogos no primeiro trimestre.

GateNews6h atrás

The Graph lança funcionalidade de pagamentos x402, suportando USDC por acesso a dados on-chain mediante pedido em 12 de maio

De acordo com o anúncio oficial da The Graph a 12 de maio, o Graph Gateway passou a suportar pagamentos x402, permitindo que programadores e Agentes de IA acedam a dados on-chain através de pagamentos por pedido em USDC, sem necessidade de chaves de API, contas ou painéis. Os utilizadores recebem uma resposta HTTP 402 com informação de preço e, em seguida, completam um pagamento em USDC baseado em assinatura na rede Base para obter dados em pedidos subsequentes. A atualização inclui um novo endp

GateNews7h atrás

A SAP investe na n8n, duplicando a avaliação da plataforma de automatização de fluxos de trabalho para 5,2 mil milhões de dólares

Segundo a Bloomberg, a SAP investiu na n8n na terça-feira, duplicando a avaliação da plataforma de automação de fluxos de trabalho para 5,2 mil milhões de dólares. O gigante alemão do software também assinou um acordo de parceria plurianual com a n8n para integrar as ferramentas da plataforma na plataforma de agentes de IA Joule Studio da SAP, de acordo com a declaração da SAP.

GateNews8h atrás

DAPPOS Lança xBubble, um Agente Universal de IA com 10+ Funcionalidades Principais para Utilizadores Não Técnicos

Segundo o ChainCatcher, a DAPPOS lançou oficialmente o xBubble, um produto universal de agentes de IA concebido para utilizadores não técnicos. O produto recomenda automaticamente agentes especializados para concluir tarefas com prompts mínimos e menos iterações de depuração. O xBubble disponibiliza 10+ capacidades centrais que abrangem a criação de imagens, vídeos, documentos e websites, apoiando tanto a implementação local como na nuvem.

GateNews13h atrás

A Nous Research lança o agente Hermes para controlo do computador em macOS, reduzindo o consumo de tokens em 95%

A Nous Research anunciou que o seu Hermes Agent lançou funcionalidades de controlo de computadores macOS, segundo monitorização da Beating. A funcionalidade permite operações em segundo plano, como pesquisas de e-mails e escrita de código, sem interferir com a entrada do utilizador ou com o foco da janela. Através de um mecanismo de compressão de contexto em quatro camadas, a estrutura reduz o consumo de tokens de aproximadamente 600.000 para 30.000 tokens ao executar 20 operações consecutivas n

GateNews15h atrás
Comentar
0/400
Nenhum comentário