Só sabe Vibe Coding, não se torna um especialista! Anthropic revela a verdade: conhecimento especializado é mais importante do que escrever código

Relatório aponta que, ao usar inteligência artificial para programar, conhecimento de domínio e capacidade de validação são mais importantes do que habilidades de programação. Possuir julgamento profissional e habilidade de formular questões pode aumentar significativamente a taxa de sucesso da tarefa.

16 de junho, Anthropic publicou o relatório de pesquisa 《Agentic coding and persistent returns to expertise》 (coding agentic refere-se a "programação delegada", onde você dá comandos, a IA lê arquivos e executa as tarefas).

O relatório analisa cerca de 235 mil usuários e aproximadamente 400 mil interações com Claude Code entre outubro de 2025 e abril de 2026, tentando responder a uma questão que preocupa muitas pessoas: pessoas sem treinamento formal em programação podem realmente comandar a IA para realizar tarefas técnicas complexas?

A resposta do relatório é afirmativa, mas o que realmente merece atenção é a conclusão: talvez não seja tão importante saber programar, e sim entender profundamente a questão que você quer resolver.

"Todo mundo pode programar", essa frase só está parcialmente correta

No último ano, o "vibe coding" (programar por feeling — usar linguagem natural para descrever o que deseja, e a IA gera o código executável, sem precisar entender cada linha) se popularizou entre os desenvolvedores. Seguindo essa tendência, a narrativa mais comum é: a barreira para programar foi derrubada, todo mundo é engenheiro.

Quem se beneficia mais dessa narrativa? Fabricantes de ferramentas de IA, e empresários que pensam em dispensar engenheiros. Mas o relatório ajusta essa visão para uma versão mais pragmática.

A Anthropic avalia cada usuário em cada conversa, atribuindo uma classificação de nível de "iniciante a especialista" com base na transcrição. É importante notar que esse nível de especialização não está relacionado ao cargo ou à inteligência da pessoa, mas sim à tarefa específica.

O relatório cita um exemplo crucial: um contador que nunca usou Python, mas que consegue explicar claramente as regras de conciliação e identificar erros de margem que a IA possa ter deixado passar na liquidação mensal, é considerado um especialista naquela tarefa; por outro lado, um engenheiro experiente que faz sua primeira pergunta sobre Rust é considerado um iniciante.

Em outras palavras, o "domínio" aqui não é sobre saber programar, mas sobre entender "o problema em si". Por isso, reduzir o relatório à ideia de que "todo mundo pode substituir engenheiros" é um equívoco: o conhecimento de domínio é uma forma de julgamento profissional que exige anos de experiência, não desapareceu, apenas mudou de posição e virou um gargalo.

Como funciona a divisão de tarefas: você formula a questão, a IA responde

A imagem mais clara do relatório mostra a divisão de decisão entre humanos e IA. A Anthropic divide cada decisão em "planejamento" (o que fazer, qual método usar, como saber que terminou) e "execução" (alterar arquivo, escrever código, usar linguagem). Como resultado: em média, humanos fazem cerca de 70% do planejamento, enquanto Claude realiza cerca de 80% da execução.

Fonte: Anthropic

Simplificando, o humano é responsável por formular as perguntas e validar as respostas, enquanto a IA executa as tarefas. Além disso, quanto mais experiente o usuário, mais essa divisão tende a favorecer "soltar a mão": o relatório mostra que, para iniciantes, cada comando dispara cerca de 5 ações da IA e gera aproximadamente 600 palavras; para especialistas, cada comando dispara cerca de 12 ações e produz cerca de 3.200 palavras. Pessoas mais experientes se sentem mais confiantes para delegar tarefas maiores, pois sabem como descrever e validar.

Fonte: Anthropic

Essa é a primeira surpresa do relatório: quanto mais forte a IA, maior o efeito de alavancagem dos especialistas, ao contrário do que se poderia imaginar, ela não diminui, mas amplia essa vantagem.

Os números que realmente fazem a diferença estão na taxa de sucesso

A Anthropic mede o sucesso da conversa de duas formas: a mais permissiva é "pelo menos parcialmente bem-sucedida"; a mais rigorosa é o "sucesso verificado" (que significa que, além da avaliação da IA, há evidências concretas como commits no git, testes passando ou validação explícita do usuário).

Segundo o padrão mais rigoroso, a taxa de sucesso verificado para iniciantes é de apenas 15%, enquanto para intermediários e especialistas sobe para 28% a 33%. No padrão mais permissivo, iniciantes alcançam 77%, e intermediários e avançados, entre 91% e 92%.

Fonte: Anthropic

Mas há um detalhe importante: a maior parte do ganho ocorre na transição de "iniciante para intermediário"; além disso, a curva de melhora ao passar de intermediário para especialista é relativamente plana. Segundo o relatório, basta ter uma compreensão básica de um domínio e ser capaz de colocar a mão na massa para obter a maior parte dos benefícios; a profundidade de conhecimento adicional traz ganhos menores.

A diferença também se manifesta na resistência ao problema: quando a conversa encontra dificuldades (erros, testes falhando, tentativas repetidas), 19% dos iniciantes desistem sem escrever uma linha de código, enquanto essa taxa cai para 5-7% entre os demais. O relatório interpreta isso como uma habilidade de redirecionar a IA de volta ao caminho certo, que também faz parte do profissionalismo.

Uma descoberta subestimada: a diferença de desempenho entre profissões é menor do que se imagina

Se o background em programação fosse realmente tão decisivo, engenheiros de software deveriam estar muito à frente. Mas os dados mostram o contrário.

Nas conversas que geram código, a taxa de sucesso verificado de profissionais de TI é de cerca de 34%, enquanto de outras profissões é de aproximadamente 29%, uma diferença de apenas 5 pontos percentuais, e essa diferença não aumentou nem diminuiu ao longo de sete meses.

O relatório analisou as dez principais profissões na base de dados, e cada uma delas apresenta uma taxa de sucesso dentro de 7 pontos percentuais da de engenheiros de software. Ainda mais surpreendente, gestores têm uma taxa de sucesso verificado ligeiramente superior à dos engenheiros.

O relatório oferece duas possíveis explicações: uma, que gestores "comandam, delegam e definem tarefas" de uma forma que pode ser transferida para o comando da IA; e outra, que a métrica de sucesso verificado é influenciada pelo fato de que o usuário precisa explicitamente confirmar na conversa "é isso mesmo", algo que gestores podem fazer com mais facilidade.

Nos últimos sete meses, também há uma mudança interessante: o tempo dedicado a debug (identificação e correção de bugs) caiu de 33% para 19%, quase pela metade; enquanto o tempo dedicado a operação de software (implantação, configuração, execução) aumentou de 14% para 21%, e a escrita e análise de dados quase dobrou, passando de cerca de 10% para 20%.

O relatório estima, usando uma comparação com o mercado de freelancing (declarando que é uma estimativa relativa, não um valor exato), que o valor médio de cada tarefa aumentou cerca de 27% nesse período (o resumo do relatório menciona aproximadamente 25%).

O que o relatório não diz, mas deveria

O relatório admite suas limitações: não consegue acompanhar os resultados no mundo real, ou seja, não sabe se o código gerado foi realmente utilizado posteriormente; também exclui usos "não interativos" (como integrar Claude Code em processos automáticos), que representam uma parte significativa. Todas as classificações são baseadas na leitura da transcrição pelo modelo, portanto, trata-se de uma "foto" inicial, não uma conclusão definitiva.

Mais importante para profissionais de conhecimento é a questão que o relatório deixa no final: a Anthropic afirma que continuará monitorando uma questão central: se o "retorno do conhecimento de domínio" começar a diminuir, isso indicará que o modelo está começando a fornecer por si só o tipo de julgamento que atualmente depende do usuário.

A lição dessa análise é: você não precisa se preocupar em aprender a programar só porque não sabe; um investimento mais inteligente é aprofundar seu conhecimento na sua área de atuação, e deixar claro o que significa "estar certo".

Primeiro, entenda bem o problema, depois use a IA para acelerar a solução; primeiro valide, depois solte a mão.

  • Este artigo foi reproduzido com autorização de: 《数位时代》
  • Título original: 《Não basta saber programar! Anthropic revela a verdade do Vibe coding: mais importante que programar, é o "conhecimento do seu campo"》
  • Autor original: 李先泰
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado