Num recente experimento de negociação em criptomoedas, um modelo de IA chinês denominado DeepSeek apresentou um desempenho impressionante—em apenas 9 dias, aumentou o seu capital inicial de 10 000 $ para 22 500 $ na competição de trading Alpha Arena, alcançando um retorno notável de 125 %.
Este resultado superou inclusivamente o modelo Qwen 3 Max da Alibaba, posicionando o DeepSeek como uma estrela emergente no setor de trading com IA.
As Origens e Evolução do DeepSeek
O DeepSeek é uma empresa de IA sediada em Hangzhou, China, fundada em 2023 com investimento da reconhecida gestora quantitativa High-Flyer.
A empresa dedica-se ao desenvolvimento de modelos avançados de linguagem de grande escala e tecnologias associadas, tendo já lançado vários modelos, incluindo DeepSeek LLM, DeepSeek Coder, DeepSeekMath e DeepSeek-VL.
A 20 de janeiro de 2025, o DeepSeek lançou oficialmente o DeepSeek-R1, um modelo que iguala o OpenAI O1 em tarefas de matemática, programação e raciocínio em linguagem natural. A versão mais recente, DeepSeek-V3.2, tem recebido significativa atenção por reduzir os custos de inferência de IA para apenas um sexto a um sétimo do valor da V3.1, acelerando simultaneamente o processamento de contexto longo em duas a três vezes.
Família de Modelos DeepSeek e Evolução Técnica
Arquitetura de Modelo Inovadora
A arquitetura técnica do DeepSeek combina variantes da estrutura Transformer com mecanismos dinâmicos de atenção, conseguindo equilibrar a compreensão semântica e a geração através da fusão multiescalar de características.
Os seus principais pontos fortes evidenciam-se em três áreas fundamentais:
- Mecanismo Dinâmico de Atenção Esparsa: Ao introduzir unidades com portas que alocam dinamicamente os pesos de atenção, o DeepSeek mantém uma forte capacidade de processamento de textos extensos, reduzindo simultaneamente a complexidade computacional. No tratamento de documentos com 100 000 tokens, a computação é reduzida em 42 % face aos Transformers convencionais.
- Sistema Mixture-of-Experts: Utilizando um mecanismo de encaminhamento por 16 módulos especialistas, cada token ativa apenas 2 a 3 especialistas, aumentando a capacidade do modelo e controlando os custos de inferência.
- Estratégia Progressiva de Treino: O DeepSeek recorre a pré-treino faseado, afinação por instrução e aprendizagem por reforço com feedback humano. Em cenários de geração de código, a amplificação sintética de dados eleva a precisão do código para 89,7 %.
Desempenho Excecional
No benchmark MMLU, o modelo DeepSeek-72B obteve uma pontuação de 81,3 em áreas STEM como matemática e física, superando os 79,8 do GPT-4.
Em tarefas de preenchimento de código, atingiu uma taxa Pass@1 de 68,2 %, uma melhoria de 12 pontos face ao Codex.
Desempenho do DeepSeek em Mercados Cripto e Financeiros
Destaque em Competições de Trading de Criptomoedas
No projeto de investimento Alpha Arena promovido pela Nof1, o Chat V3.1 do DeepSeek demonstrou capacidades excecionais de negociação.
A competição atribuiu a seis modelos de IA um capital inicial de 10 000 $ cada, operando sob condições idênticas de informação de mercado para negociar ativos digitais como Bitcoin, Ether e Dogecoin, em busca dos maiores retornos.
A 28 de outubro, o DeepSeek já tinha alcançado um retorno de 125 %, destacando-se largamente face aos concorrentes internacionais.
Em comparação, o GPT-5 da OpenAI perdeu quase 60 % dos seus fundos, reduzindo o saldo para cerca de 4 000 $, enquanto o Gemini 2.5 Pro da Google DeepMind sofreu uma perda de 57 %.
Na plataforma de previsão Polymarket, os traders atribuíram ao DeepSeek uma probabilidade de vitória de 61 %, significativamente superior aos 29 % da Alibaba.
Desempenho Sólido na Negociação de Ações Americanas
O DeepSeek destacou-se igualmente na negociação de ações dos EUA.
No experimento open-source "AI-Trader", liderado pela Universidade de Hong Kong, o DeepSeek liderou o ranking durante um período de teste de um mês, com uma taxa de retorno anualizada de 10,61 %, comparativamente aos 2,13 % do índice de referência Nasdaq 100 de tecnológicas.
Isto significa que os retornos do DeepSeek foram quase cinco vezes superiores ao benchmark.
Vantagem de Preço da API DeepSeek e Estratégia Open-Source
Reduções Significativas de Preço
A 29 de setembro de 2025, o DeepSeek lançou o modelo DeepSeek-V3.2-Exp e anunciou reduções substanciais nos preços da API.
Segundo a nova política de preços, os acertos na cache de tokens de entrada são tarifados a 0,2 RMB por milhão de tokens, os falhanços a 2 RMB por milhão, e a saída a 3 RMB por milhão de tokens—uma redução superior a 50 % face às tarifas anteriores.
O mais recente modelo DeepSeek-V3.2 reduz ainda mais os custos de inferência de IA para apenas um sexto a um sétimo do valor da V3.1, com preços de API fixados em 0,28 $/0,028 $/0,42 $ por milhão de tokens de entrada/cache/saída, respetivamente.
Estratégia Open-Source e Implementação Localizada
O DeepSeek utiliza a licença MIT e foi otimizado para chipsets Huawei e outros processadores chineses, facilitando a implementação em ambientes informáticos locais na China.
Esta abordagem open-source permite aos programadores implementar gratuitamente e de forma privada os modelos DeepSeek, desbloqueando novas possibilidades para aplicações empresariais.
Perspetivas Futuras
À medida que a tecnologia de trading com IA continua a evoluir, é evidente que modelos nacionais de grande escala como o DeepSeek terão um papel cada vez mais relevante no futuro das criptomoedas e dos mercados financeiros em geral.
Para os traders de cripto, acompanhar o desenvolvimento do DeepSeek não é apenas uma questão de estar na vanguarda da tecnologia de IA—é também uma oportunidade para identificar potenciais investimentos num panorama financeiro em transformação.


