RL fine-tuning faz o modelo 4B superar o 235B em perguntas financeiras: Ambiente de treino FinQA de código aberto da Snorkel AI

BlockBeatNews

2026-03-31 05:35:43

De acordo com a monitorização da 1M AI News, a Snorkel AI lançou o FinQA, um ambiente de treino para aprendizagem por reforço construído a partir de documentos financeiros reais da SEC 10-K, e já foi disponibilizado em código aberto na plataforma OpenEnv, conjuntamente mantida pela Meta, PyTorch e Hugging Face. O FinQA abrange 290 perguntas e respostas financeiras com anotações de especialistas de 22 empresas cotadas (incluindo Alphabet, Amazon, Apple, Bank of America, Boeing), fornecendo ao Agent 4 ferramentas MCP: listar as tabelas financeiras disponíveis, obter a estrutura das tabelas, executar consultas SQL e submeter respostas. A SQL exige obrigatoriamente filtros e proíbe o SELECT *, obrigando o Agent a recolher apenas os dados necessários, em vez de despejar a tabela inteira.

A Snorkel AI, em colaboração com a equipa rLLM da Universidade da Califórnia, Berkeley, usou o FinQA para fazer afinação por aprendizagem por reforço do Qwen3-4B. Os resultados, no benchmark de perguntas e respostas financeiras SnorkelFinance, atingiram 59,7%, superando o Qwen3-235B da mesma série (51,37%). Com um número de parâmetros de cerca de 1/60 do de este, o custo de inferência desceu cerca de 90%. Principais conclusões: os grandes modelos conseguem raciocinar, mas geram nomes de colunas alucinados e ignoram as restrições SQL; em contrapartida, o modelo pequeno após treino por RL consegue, de forma mais precisa, invocar as ferramentas, e «a disciplina das ferramentas» — mais do que a escala — é o verdadeiro gargalo.

O FinQA é o primeiro ambiente de código aberto publicado pela Snorkel AI na OpenEnv; no futuro serão lançados ambientes empresariais de múltiplas rondas que abrangerão setores como saúde, seguros e direito.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Comentar

0/400

Nenhum comentário