Destilação em Escala: Como 25 Mil Contas Falsas Teriam Copiado o Claude 28 Milhões de Vezes – ABRACD – ASSOCIAÇÃO BRASILEIRA DE CIÊNCIA DE DADOS

A Anthropic foi ao Senado americano com um número preciso: 28,8 milhões de conversas, conduzidas por aproximadamente 25 mil contas falsas, entre abril e junho deste ano. O objetivo declarado, segundo a empresa, era executar em escala industrial uma técnica conhecida como destilação de modelos, usando as respostas do Claude para treinar um modelo rival mais barato com capacidades equivalentes.

A acusação aponta para a Alibaba. A empresa chinesa não se pronunciou.

O Que é Destilação de Modelos

A destilação não é novidade no campo da inteligência artificial. A técnica consiste em usar as saídas de um modelo grande e caro como dados de treinamento para um modelo menor e mais eficiente. Quando feita com dados próprios, é uma prática legítima e amplamente usada. Quando feita com respostas de um modelo comercial de terceiros, sem autorização, entra em território legal e ético contestado.

O que torna o caso relevante não é apenas a escala, descrita pela Anthropic como a maior operação do tipo já registrada contra o Claude. É a assimetria econômica que a técnica expõe. Construir um modelo de fronteira como o Claude exige anos de pesquisa, centenas de milhões de dólares em infraestrutura e uma equipe de segurança dedicada. Copiá-lo por destilação, pergunta a pergunta, custa uma fração desse valor.

Um Padrão Sistemático

Não é a primeira vez que a Anthropic identifica esse padrão. Em fevereiro, a empresa já havia sinalizado operações similares atribuídas ao DeepSeek, Moonshot e MiniMax, todos com origem na China. A repetição sugere menos uma série de incidentes isolados e mais uma estratégia sistemática de aquisição de capacidade tecnológica a custo reduzido.

A Anthropic quer que o Congresso torne a prática ilegal. O pedido é compreensível, mas enfrenta um problema estrutural: a legislação americana não tem alcance sobre servidores operados fora do país. Banir a destilação não autorizada nos Estados Unidos não impede que ela aconteça em infraestrutura chinesa acessando APIs abertas ao mundo.

A Questão da Propriedade Intelectual em IA

O debate que se abre é mais amplo. Se um modelo pode ser copiado uma resposta de cada vez, qual é o valor real da propriedade intelectual em inteligência artificial? E quem define onde termina o uso legítimo de uma API e começa a extração sistemática de conhecimento proprietário?