Anthropic traça o caminho para a IA com auto-melhoramento recursivo

Em junho de 2026, o Anthropic Institute publicou um dos documentos mais reveladores da história recente da inteligência artificial: um relatório detalhando o progresso real da empresa em direção ao chamado auto-melhoramento recursivo (RSI — Recursive Self-Improvement). O artigo, intitulado “When AI builds itself”, combina dados públicos de benchmarks com evidências internas inéditas — e o que ele mostra muda o referencial do que considerávamos possível.

O que é auto-melhoramento recursivo?

RSI é o ponto em que um sistema de IA consegue, de forma totalmente autônoma, projetar e desenvolver seu próprio sucessor. A Anthropic é categórica: ainda não chegamos lá. Mas o caminho está sendo traçado, e a velocidade com que os marcos estão sendo alcançados é o dado mais relevante do relatório.

A empresa mapeou quatro estágios históricos até o presente — e um quinto ainda por vir:

  • 2021–2023: Engenheiros humanos construindo o primeiro Claude do zero
  • 2023–2025: Chatbots auxiliando com trechos curtos de código
  • 2025–2026: Agentes de codificação escrevendo e editando arquivos inteiros de forma autônoma
  • Hoje: Agentes autônomos rodando código e delegando horas de trabalho para outros agentes
  • 20XX? Fechar o loop — agentes capazes de construir e treinar os próprios modelos sucessores

Os números que mudam tudo

Os dados internos da Anthropic são os mais impactantes do relatório. Em maio de 2026, mais de 80% do código integrado à base de código da empresa foi escrito pelo próprio Claude — um número que estava na casa de um dígito antes do lançamento do Claude Code em fevereiro de 2025. No segundo trimestre de 2026, o engenheiro típico estava integrando 8 vezes mais código por dia do que em 2024.

Em benchmarks externos, o salto é igualmente expressivo. Em março de 2024, o Claude Opus 3 conseguia completar tarefas de software que levavam cerca de quatro minutos para um humano. Um ano depois, o Claude Sonnet 3.7 atingiu tarefas de uma hora e meia. Em 2026, o Claude Opus 4.6 chegou a tarefas de 12 horas de duração — com a duração dobrando a cada quatro meses. A projeção é que tarefas de dias estejam ao alcance ainda em 2026, e tarefas de semanas em 2027.

De assistente a pesquisador autônomo

O relatório apresenta um caso especialmente revelador: em abril de 2026, a Anthropic publicou a primeira demonstração de agentes Claude conduzindo um projeto de pesquisa de ponta a ponta, sem direção humana significativa. O problema escolhido foi aberto — investigar se um modelo mais fraco consegue supervisionar um mais forte de forma confiável. Dois pesquisadores humanos, em uma semana, recuperaram 23% do “gap” de desempenho possível. Os agentes, ao longo de 800 horas acumuladas e com custo de $18 mil em computação, recuperaram 97%.

Outro dado relevante: em um benchmark interno de otimização de código de treinamento, o Claude Opus 4 atingia em média 3x de speedup em maio de 2025. Em abril de 2026, o Claude Mythos Preview chegou a 52x — enquanto um pesquisador humano habilidoso levaria de quatro a oito horas para alcançar 4x.

O que a Anthropic pede ao mundo

O tom do relatório não é triunfalista — é de alerta. A empresa deixa claro que o auto-melhoramento recursivo total poderia aumentar os riscos de perda de controle humano sobre sistemas de IA. E vai além: afirma que, se fosse possível desacelerar o desenvolvimento de forma eficaz e equitativa globalmente, isso provavelmente seria positivo.

A proposta é ambiciosa: construir mecanismos internacionais de verificação que permitam a múltiplos laboratórios desacelerar ou pausar o desenvolvimento de forma coordenada e verificável — semelhante a tratados de controle armamentista, mas aplicado à IA. A Anthropic reconhece que isso levaria décadas para ser construído, e que o tempo disponível é muito menor.

O que isso significa para organizações e profissionais

O relatório da Anthropic não é ficção científica. É uma radiografia do presente. Empresas que ainda tratam IA como ferramenta de suporte periférico estão subestimando uma transformação estrutural em curso. A tendência de compressão do tempo de execução de tarefas — do que levava dias para o que agora leva horas — está reposicionando o diferencial competitivo de organizações inteiras.

Para profissionais de dados, engenharia e gestão, a pergunta central não é mais “a IA vai me substituir?”, mas “qual é o meu papel quando a execução custar quase zero em tempo humano?”. O relatório da Anthropic sugere que o julgamento, a definição de problemas relevantes e a supervisão de outputs ainda são território humano — por enquanto.

O loop ainda não se fechou. Mas o ritmo com que está se fechando exige que organizações e governos comecem a se preparar agora.

Fonte: Anthropic Institute — “When AI builds itself” (junho de 2026) | anthropic.com/institute/recursive-self-improvement