Pagar com

USD

Visa, Mastercard, SEPA e mais

Negociação flexível e sem taxas

Cartão da Gate

Pague com criptomoedas no mundo todo

Básico

Negocie criptomoedas livremente

Amplie seu lucro com alavancagem

Convert & Auto-Invest

Trade any size with no fees and no slippage

Exposição para posições alavancadas de forma simples

Negociação pré-mercado

Negocie novos tokens pré-listagem

Avançado

Negocie on-chain com a Gate Wallet

Acesso inteligente a novos tokens on-chain

Estratégias smart e negociação automática

Siga estratégias de especialistas

Negociação CrossEx

Um único saldo de margem, compartilhado entre as plataformas

Acesse centenas de contratos perpétuos

Plataforma única para ativos tradicionais globais

Negocie opções vanilla no estilo europeu

Conta unificada

Maximize sua eficiência de capital

Negociação demo

Introdução à negociação de futuros

Prepare-se para sua negociação de futuros

Eventos de futuros

Participe de eventos e ganhe recompensas

Negociação demo

Use fundos virtuais para experimentar negociações sem riscos

Derivativos de CFD de ações dos EUA

Ações dos EUA

Acesse ações e ETFs reais dos EUA

Ações de Hong Kong

Negocie ações de qualidade listadas em Hong Kong

Futuros de ações

Alta alavancagem, negociação 24/7

Ações tokenizadas

Respaldado por ativos de ações reais

Desbloqueie o acesso completo a IPO de ações globais

Cunhe GUSD para rendimentos de RWA do Tesouro

Atividades de ações

Negocie ações populares e desbloqueie airdrops generosos

Lançamento

Colete candies para ganhar airdrops

Staking rápido, ganhe novos tokens em potencial

Possua GT em hold e ganhe airdrops massivos de graça

Desbloqueie o acesso completo a IPO de ações globais

Negocie on-chain e receba airdrops

Pontos de futuros

Ganhe pontos de futuros e colete recompensas em airdrop

Investimento

Ganhe juros com tokens ociosos

Autoinvestimento

Invista automaticamente regularmente

Investimento duplo

Lucre com a volatilidade do mercado

Ganhe recompensas com stakings flexíveis

Empréstimo de criptomoedas

Penhore uma criptomoeda para pegar outra emprestado

Centro de empréstimos

Centro de empréstimos integrado

Centro de riqueza VIP

Planos premium de crescimento de patrimônio

Gestão privada de patrimônio

Alocação premium de ativos

Fundo Quantitativo

Estratégias quant de alto nível

Faça staking de criptomoedas para ganhar em produtos PoS

Alavancagem Inteligente

Alavancagem sem liquidação

Sem bloqueio, negocie e saque

Descubra o valor em criptografia

Análise de mercado de criptomoedas ao vivo

Converse com os traders de criptomoedas

Novidades sobre criptomoedas

Mais

Promoções

Centro de atividade

Participe de atividades e ganhe recompensas

Convide amigos para recompensas de ind.

Programa de afiliados

Ganhe recomp. de comissão exclusivas

Aumente a influência e ganhe airdrops

Atualizações na plataforma em tempo real

Artigos do setor de criptomoedas

Grandes Descontos nas Taxas

Gerenciamento de ativos

Solução completa de gerenciamento de ativos

Soluções de ativos digitais para empresas

Desenvolvedores (API)

Conecta-se ao ecossistema de aplicativos da Gate

Transferência Bancária OTC

Deposite e retire moedas fiat

Programa de corretoras

Mecanismos de grandes descontos via API

AI

Seu parceiro de IA conversacional para todas as horas

Use o Gate AI diretamente no seu aplicativo social

Gate Blue Lobster, pronto para usar

Gate for AI Agent

Infraestrutura de IA, Gate MCP, Skills e CLI

Gate Skills Hub

10K+ habilidades

Do escritório à negociação: um hub completo de habilidades para turbinar o uso da IA

Outros

Central de Ajuda

Encontre perguntas frequentes e guias de ajuda

Saiba mais sobre o investimento em criptomoedas

Cresça com os campeões

Comprovante de Reservas

Gate promete 100% de comprovação de reservas

Mantenha seus ativos seguros

Método de treinamento após a busca pública do agente Perplexity, baseado no modelo Qwen3.5 que supera GPT-5.4 em precisão e custo

2026-04-23 05:07:25

De acordo com o monitoramento Beating, a equipe de pesquisa Perplexity publicou um artigo técnico, divulgando seu processo de pós-treinamento do agente de busca na web.
Esse processo é baseado nos modelos de código aberto Qwen3.5-122B-A10B e Qwen3.5-397B-A17B, adotando uma abordagem de duas fases: primeiro, usando ajuste supervisionado (SFT) para estabelecer comportamentos essenciais de implantação, como seguimento de instruções e consistência linguística; depois, usando aprendizado por reforço (RL) online para otimizar a precisão da busca e a eficiência no uso de ferramentas.

A fase de RL utiliza o algoritmo GRPO, com dados de treinamento compostos por duas partes: uma é um conjunto de dados de perguntas e respostas verificáveis de múltiplos saltos, sintetizado internamente, partindo de consultas sementes internas, construindo perguntas que requerem raciocínio de 2 a 4 saltos através de encadeamento de entidades, e verificando a unicidade da resposta com múltiplos solucionadores independentes; a outra é um conjunto de dados de diálogo geral baseado em critérios de avaliação (rubric), convertendo requisitos de implantação como seguimento de instruções e restrições de formato em condições atômicas verificáveis objetivamente, para evitar a degradação do comportamento estabelecido pelo SFT na fase de RL.

O núcleo do design de recompensa é a agregação por controle: apenas quando a resposta base está correta (pergunta e resposta ou todos os critérios do rubric atendidos), a pontuação de preferência participa do cálculo, prevenindo que sinais de preferência elevados ocultem erros factuais.
A penalidade de eficiência usa uma abordagem de ancoragem dentro do grupo, baseando-se na resposta correta do grupo, aplicando penalidades suaves ao número de chamadas de ferramenta e ao comprimento de geração que excedem esse padrão.

A avaliação mostra que o Qwen3.5-397B-SFT-RL pós-treinamento apresenta o melhor desempenho em vários benchmarks de busca.
No FRAMES, uma única chamada de ferramenta atinge 57,3%, 5,7 pontos percentuais acima do GPT-5.4 e 4,7 pontos acima do Sonnet 4.6.
Com orçamento moderado (4 chamadas de ferramenta), alcança 73,9%, com custo por consulta de 2,0 centavos de dólar; sob as mesmas condições, GPT-5.4 é 67,8% / 8,5 centavos, e Sonnet 4.6 é 62,4% / 15,3 centavos.
Os dados de custo são calculados com base nos preços de API divulgados por cada fornecedor, sem otimizações de cache.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.

Comentário

0/400

Sem comentários