← Blog

Três dias de vida: o que o caso Fable 5 e Mythos 5 nos conta sobre o futuro da IA

15 jun 2026

Tem semanas em que a indústria de tecnologia anda no ritmo de sempre. E tem semanas em que um modelo de IA nasce na terça e é desligado na sexta. A da Anthropic foi a segunda.

No dia 9 de junho, a empresa lançou dois modelos da sua linha mais poderosa, a classe Mythos. Um deles, o Fable 5, era o primeiro dessa família liberado para o público em geral — uma versão com classificadores de segurança na frente, pensada para ser usável sem virar arma. O outro, o Mythos 5, ficou restrito a parceiros selecionados de um programa de cibersegurança chamado Project Glasswing, que já reunia mais de 150 organizações testando essas capacidades dentro dos próprios ambientes.

Três dias depois, na sexta-feira, às 17h21 no horário de Brasília-mais-uns-fusos (era horário de Nova York), chegou uma carta. E os dois modelos saíram do ar para todo mundo.

O que diz a carta

Quem mandou foi o Departamento de Comércio dos Estados Unidos. O instrumento foi uma diretiva de controle de exportação, justificada por "autoridades de segurança nacional". O conteúdo: suspender todo e qualquer acesso ao Fable 5 e ao Mythos 5 por parte de qualquer estrangeiro — dentro ou fora dos EUA, incluindo os próprios funcionários estrangeiros da Anthropic.

A carta não detalhou qual era, exatamente, a preocupação técnica.

Aqui mora a primeira ironia operacional do caso. Uma plataforma de IA servida via API e produtos de chat não tem como filtrar nacionalidade em tempo real, requisição por requisição. Ou você bloqueia estrangeiros — e não sabe quem é estrangeiro no instante da chamada — ou você não bloqueia ninguém. Diante dessa impossibilidade prática, a Anthropic fez a única coisa que garantia conformidade: desligou os dois modelos para o planeta inteiro.

Vale registrar o que não foi afetado, porque é o que mantém o serviço de pé: os demais modelos seguem normais. A própria empresa indicou o Opus 4.8 como o caminho de migração imediato para quem dependia do Fable 5 em produção. A string de API do Fable passou a responder com erro. Para quem tinha pipeline rodando em cima dele, foi trocar o motor com o carro andando.

A briga técnica: um "jailbreak" no centro de tudo

O motivo da intervenção, segundo o entendimento da própria Anthropic, é a alegação de que existe um método de jailbreak capaz de furar os classificadores de segurança do Fable 5 — em tese, liberando capacidades perigosas, especialmente na área de descoberta de vulnerabilidades de software.

A resposta pública da empresa foi firme e, ao mesmo tempo, cuidadosa. Ela disse ter revisado uma demonstração da técnica e que, na prática, ela só expôs um punhado de vulnerabilidades já conhecidas e de baixa gravidade — vulnerabilidades que outros modelos disponíveis publicamente também encontram, sem precisar de bypass nenhum.

A posição da Anthropic, resumida: discordamos, mas obedecemos. Eles argumentam que recolher um modelo comercial usado por centenas de milhões de pessoas por causa de um jailbreak estreito e de baixo impacto é desproporcional — e que, se esse virasse o critério padrão da indústria, simplesmente não se lançaria mais nenhum modelo de fronteira, de nenhuma empresa. Porque a verdade incômoda, que eles colocaram desde o lançamento, é que resistência perfeita a jailbreak não existe hoje para provedor nenhum.

Para quem é da casa, dois detalhes de arquitetura ajudam a entender o desenho de segurança. Testes externos confirmaram que a Anthropic posiciona classificadores na frente do modelo e, em entradas sensíveis, faz fallback para o Opus 4.8 — algo que, segundo a empresa, acontece em menos de 5% das sessões. E há uma exigência de retenção de dados por 30 dias para todo o tráfego dos modelos classe Mythos, justamente para detectar padrões de abuso que não aparecem numa única interação. Não é um detalhe menor: é uma escolha explícita de trocar um pouco de privacidade por capacidade de auditar uso indevido.

Por que isso é maior do que um modelo

Se a história fosse só "modelo sai do ar por bug de segurança", não valeria cinco minutos da sua atenção. O que torna o caso relevante é o que ele expõe sobre o terreno em que a IA de fronteira está pisando.

Primeiro, o precedente. Foi uma ação regulatória rara — um governo usando controle de exportação para tirar do mercado, em horas, um produto de software já implantado globalmente. A discussão deixa de ser "a IA é capaz demais?" e vira "quem decide, com que critério e com que devido processo, o que pode ou não ficar de pé?". A própria Anthropic vinha defendendo que o governo deveria poder barrar implantações inseguras — mas dentro de um processo estatutário transparente, justo e ancorado em fatos técnicos. A crítica dela ao episódio é exatamente que não houve isso.

Segundo, o contexto. Essa não foi a primeira fricção entre a Anthropic e o governo americano, e ela cai num momento sensível: poucos dias antes, a empresa havia protocolado de forma confidencial seu pedido de IPO, numa avaliação na casa dos US$ 350 bilhões. Risco regulatório e segurança nacional, que antes eram nota de rodapé, agora entram na conta de qualquer investidor que olhe para o papel.

Terceiro, o pano de fundo que dá peso à preocupação do governo. A versão de prévia desses modelos, lá em abril, já tinha mexido com o mundo da cibersegurança pela capacidade de encontrar e explorar falhas em ritmo sobre-humano. Não por acaso, bancos e até o secretário do Tesouro se sentaram com a empresa naquele período, e instituições como o JPMorgan entraram no programa de testes. Quando um modelo é bom o bastante para virar assunto de Tesouro Nacional, ele também é bom o bastante para virar assunto de segurança nacional. As duas coisas andam juntas.

Onde estamos agora

No momento em que escrevo, o desfecho está em aberto. A Anthropic mandou gente técnica sênior para Washington negociar com a Casa Branca, e os relatos indicam que os dois lados querem resolver rápido. A empresa chama tudo de mal-entendido e diz estar trabalhando para restaurar o acesso o quanto antes — sem data. O cenário mais provável apontado por quem acompanha é um retorno condicional: salvaguardas extras, ou acesso liberado só para usuários verificados, dentro de dias a semanas. Mas "provável" não é "garantido".

O que fica

Para quem opera infraestrutura e sistemas, a lição prática é velha e sempre nova: dependência de um único fornecedor de fronteira é risco operacional, não só comercial. Um modelo pode sumir por motivo que não tem nada a ver com a sua engenharia — pode ser uma carta de um ministério numa sexta à tarde. Ter caminho de fallback testado deixou de ser zelo e virou requisito.

E para a indústria como um todo, o caso é um aviso de que entramos numa fase nova. A pergunta não é mais só técnica. É sobre governança, sobre quem segura a chave, e sobre como equilibrar capacidade — que cresce rápido — com salvaguardas, que crescem devagar. Um modelo que viveu três dias talvez tenha ensinado mais sobre esse equilíbrio do que muito relatório que durou anos.

Receba as publicações

Novos artigos sobre IA, Vibe Code e Builder Code — por e-mail ou Telegram.

ou
Receber no Telegram

Ao se inscrever, você concorda em receber e-mails/mensagens e com a Política de Privacidade. Você pode cancelar quando quiser. Sem spam.