Três dias de vida: o que o caso Fable 5 e Mythos 5 nos conta sobre o futuro da IA

Tem semanas em que a indústria de tecnologia anda no ritmo de sempre. E tem semanas em que um modelo de IA nasce na terça e é desligado na sexta. A da Anthropic foi a segunda.

No dia 9 de junho, a empresa lançou dois modelos da sua linha mais poderosa, a classe Mythos. Um deles, o Fable 5, era o primeiro dessa família liberado para o público em geral — uma versão com classificadores de segurança na frente, pensada para ser usável sem virar arma. O outro, o Mythos 5, ficou restrito a parceiros selecionados de um programa de cibersegurança chamado Project Glasswing, que já reunia mais de 150 organizações testando essas capacidades dentro dos próprios ambientes.

Três dias depois, na sexta-feira, às 17h21 no horário de Brasília-mais-uns-fusos (era horário de Nova York), chegou uma carta. E os dois modelos saíram do ar para todo mundo.

O que diz a carta

Quem mandou foi o Departamento de Comércio dos Estados Unidos. O instrumento foi uma diretiva de controle de exportação, justificada por "autoridades de segurança nacional". O conteúdo: suspender todo e qualquer acesso ao Fable 5 e ao Mythos 5 por parte de qualquer estrangeiro — dentro ou fora dos EUA, incluindo os próprios funcionários estrangeiros da Anthropic.

A carta não detalhou qual era, exatamente, a preocupação técnica.

Aqui mora a primeira ironia operacional do caso. Uma plataforma de IA servida via API e produtos de chat não tem como filtrar nacionalidade em tempo real, requisição por requisição. Ou você bloqueia estrangeiros — e não sabe quem é estrangeiro no instante da chamada — ou você não bloqueia ninguém. Diante dessa impossibilidade prática, a Anthropic fez a única coisa que garantia conformidade: desligou os dois modelos para o planeta inteiro.

Vale registrar o que não foi afetado, porque é o que mantém o serviço de pé: os demais modelos seguem normais. A própria empresa indicou o Opus 4.8 como o caminho de migração imediato para quem dependia do Fable 5 em produção. A string de API do Fable passou a responder com erro. Para quem tinha pipeline rodando em cima dele, foi trocar o motor com o carro andando.

A briga técnica: um "jailbreak" no centro de tudo

O motivo da intervenção, segundo o entendimento da própria Anthropic, é a alegação de que existe um método de jailbreak capaz de furar os classificadores de segurança do Fable 5 — em tese, liberando capacidades perigosas, especialmente na área de descoberta de vulnerabilidades de software.

A resposta pública da empresa foi firme e, ao mesmo tempo, cuidadosa. Ela disse ter revisado uma demonstração da técnica e que, na prática, ela só expôs um punhado de vulnerabilidades já conhecidas e de baixa gravidade — vulnerabilidades que outros modelos disponíveis publicamente também encontram, sem precisar de bypass nenhum.

A posição da Anthropic, resumida: discordamos, mas obedecemos. Eles argumentam que recolher um modelo comercial usado por centenas de milhões de pessoas por causa de um jailbreak estreito e de baixo impacto é desproporcional — e que, se esse virasse o critério padrão da indústria, simplesmente não se lançaria mais nenhum modelo de fronteira, de nenhuma empresa. Porque a verdade incômoda, que eles colocaram desde o lançamento, é que resistência perfeita a jailbreak não existe hoje para provedor nenhum.

Para quem é da casa, dois detalhes de arquitetura ajudam a entender o desenho de segurança. Testes externos confirmaram que a Anthropic posiciona classificadores na frente do modelo e, em entradas sensíveis, faz fallback para o Opus 4.8 — algo que, segundo a empresa, acontece em menos de 5% das sessões. E há uma exigência de retenção de dados por 30 dias para todo o tráfego dos modelos classe Mythos, justamente para detectar padrões de abuso que não aparecem numa única interação. Não é um detalhe menor: é uma escolha explícita de trocar um pouco de privacidade por capacidade de auditar uso indevido.

Por que isso é maior do que um modelo

Se a história fosse só "modelo sai do ar por bug de segurança", não valeria cinco minutos da sua atenção. O que torna o caso relevante é o que ele expõe sobre o terreno em que a IA de fronteira está pisando.

Primeiro, o precedente. Foi uma ação regulatória rara — um governo usando controle de exportação para tirar do mercado, em horas, um produto de software já implantado globalmente. A discussão deixa de ser "a IA é capaz demais?" e vira "quem decide, com que critério e com que devido processo, o que pode ou não ficar de pé?". A própria Anthropic vinha defendendo que o governo deveria poder barrar implantações inseguras — mas dentro de um processo estatutário transparente, justo e ancorado em fatos técnicos. A crítica dela ao episódio é exatamente que não houve isso.

Segundo, o contexto. Essa não foi a primeira fricção entre a Anthropic e o governo americano, e ela cai num momento sensível: poucos dias antes, a empresa havia protocolado de forma confidencial seu pedido de IPO, numa avaliação na casa dos US$ 350 bilhões. Risco regulatório e segurança nacional, que antes eram nota de rodapé, agora entram na conta de qualquer investidor que olhe para o papel.

Terceiro, o pano de fundo que dá peso à preocupação do governo. A versão de prévia desses modelos, lá em abril, já tinha mexido com o mundo da cibersegurança pela capacidade de encontrar e explorar falhas em ritmo sobre-humano. Não por acaso, bancos e até o secretário do Tesouro se sentaram com a empresa naquele período, e instituições como o JPMorgan entraram no programa de testes. Quando um modelo é bom o bastante para virar assunto de Tesouro Nacional, ele também é bom o bastante para virar assunto de segurança nacional. As duas coisas andam juntas.

Onde estamos agora

No momento em que escrevo, o desfecho está em aberto. A Anthropic mandou gente técnica sênior para Washington negociar com a Casa Branca, e os relatos indicam que os dois lados querem resolver rápido. A empresa chama tudo de mal-entendido e diz estar trabalhando para restaurar o acesso o quanto antes — sem data. O cenário mais provável apontado por quem acompanha é um retorno condicional: salvaguardas extras, ou acesso liberado só para usuários verificados, dentro de dias a semanas. Mas "provável" não é "garantido".

O que fica

Para quem opera infraestrutura e sistemas, a lição prática é velha e sempre nova: dependência de um único fornecedor de fronteira é risco operacional, não só comercial. Um modelo pode sumir por motivo que não tem nada a ver com a sua engenharia — pode ser uma carta de um ministério numa sexta à tarde. Ter caminho de fallback testado deixou de ser zelo e virou requisito.

E para a indústria como um todo, o caso é um aviso de que entramos numa fase nova. A pergunta não é mais só técnica. É sobre governança, sobre quem segura a chave, e sobre como equilibrar capacidade — que cresce rápido — com salvaguardas, que crescem devagar. Um modelo que viveu três dias talvez tenha ensinado mais sobre esse equilíbrio do que muito relatório que durou anos.

O que diz a carta

A briga técnica: um "jailbreak" no centro de tudo

Por que isso é maior do que um modelo

Onde estamos agora

O que fica

Receba as publicações