Anthropic restabelece Claude Fable 5 após fim de restrições dos EUA ligadas a jailbreak

A Anthropic está recolocando o Claude Fable 5 no ar em todo o mundo.

Em 30 de junho, o Departamento de Comércio dos Estados Unidos suspendeu os controles de exportação que havia imposto ao Fable e ao seu par mais restrito, o Mythos 5, cerca de duas semanas e meia antes.

A partir de quarta-feira, 1º de julho, o Fable 5 volta a estar disponível para usuários no Claude.ai, na Claude Platform, no Claude Code e no Claude Cowork.

Controles de exportação limitam quem pode receber ou usar uma tecnologia.

A ordem de 12 de junho determinava que a Anthropic bloqueasse os dois modelos para qualquer estrangeiro, dentro ou fora dos Estados Unidos, inclusive seus próprios funcionários sem cidadania norte-americana.

A regra entrou em vigor imediatamente, e a empresa não tinha um meio confiável de verificar em tempo real a nacionalidade de todos os usuários.

Por isso, desligou os dois modelos para todos.

O gatilho foi um jailbreak, isto é, um comando que leva um modelo a contornar suas regras de segurança.

Pesquisadores da Amazon encontraram um no Fable 5.

Segundo a própria Anthropic, o comando fez o modelo identificar algumas falhas de software e, em um caso, escrever código mostrando como uma falha poderia ser explorada.

A Anthropic minimizou a descoberta.

A empresa afirma que o mesmo tipo de solicitação também funciona em vários modelos mais fracos, incluindo o seu próprio Claude Opus 4.8, o GPT-5.5 da OpenAI e o Kimi K2.7, da China.

Para a empresa, o comportamento apontado é uma rotina de segurança defensiva, e não uma capacidade oculta fora do comum.

O governo e o parceiro que relatou o jailbreak consideraram o caso sério o bastante para justificar medidas emergenciais.

Para responder à preocupação, a Anthropic treinou um novo filtro de segurança, chamado classificador, para monitorar exatamente a técnica descrita no relatório e bloqueá-la.

A empresa diz que, na atualização divulgada em 30 de junho, já consegue impedir essa técnica em mais de 99% das tentativas.

As solicitações bloqueadas são encaminhadas ao Opus 4.8, mais fraco, e o usuário é avisado.

A troca é o aumento de falsos positivos em tarefas normais de programação e depuração.

Já o Mythos 5, a mesma base de modelo com menos proteções de segurança, continua sob restrição mais rígida.

O acesso foi restabelecido em 26 de junho para cerca de 100 empresas norte-americanas e agências federais que protegem infraestrutura crítica.

A Anthropic afirma que ainda trabalha com o governo para ampliar esse acesso.

O secretário de Comércio, Howard Lutnick, que assinou a reversão, disse que sua pasta passou duas semanas revisando os modelos com a Anthropic.

Em carta enviada ao governo, a empresa concordou em buscar problemas de segurança por conta própria, coordenar futuros lançamentos e comunicar qualquer uso malicioso que identificar.

As negociações teriam sido conduzidas pelo cofundador Tom Brown, e não pelo CEO Dario Amodei, que viveu atritos com o governo ao longo do ano.

A disputa começou de forma turbulenta.

Diversos relatos, entre eles o do The Wall Street Journal, apontaram que a pesquisa da Amazon e preocupações do CEO Andy Jassy ajudaram a impulsionar a ordem inicial.

O ex-czar de IA David Sacks acusou a Anthropic de ter “priorizado a continuidade da oferta do modelo para consumidores em vez da segurança”.

Outros interpretaram o episódio como um excesso de cautela.

Para Francesco Bailo, pesquisador de governança de IA da Universidade de Sydney, a reversão parecia uma admissão do governo de que havia ido longe demais.

Um grupo de líderes de segurança também havia assinado uma carta aberta pedindo a suspensão dos controles.

No pano de fundo estava a competição.

A pausa ocorreu justamente quando modelos open source chineses, baratos e capazes, ganhavam espaço, e vários executivos alertavam que congelar modelos dos Estados Unidos dava tempo gratuito aos rivais para se aproximarem.

A Anthropic também propõe algo que o setor ainda não tem: uma forma compartilhada de medir o quão perigoso é um jailbreak.

Com a Amazon, a Microsoft, o Google e outros parceiros, a empresa quer atribuir pontuação a cada caso com base em quatro critérios:

Capacidade adicional: o quanto o jailbreak leva o usuário além das ferramentas que ele já tinha.

Amplitude: quantos tipos diferentes de ataque a mesma técnica desbloqueia.

Facilidade de transformação em arma: quanto conhecimento e esforço são necessários para converter a falha em um ataque real.

Descoberta: o quão fácil é encontrar ou copiar a técnica.

Nos casos mais graves, como um jailbreak que permita ataques a redes elétricas ou bancos, a Anthropic diz que começará a aplicar correções assim que a gravidade for confirmada.

A empresa também está montando uma equipe para monitorar relatórios de jailbreak 24 horas por dia.

Além disso, abriu um programa no HackerOne para que pesquisadores reportem novos jailbreaks do Fable 5 e prometeu ao governo dos Estados Unidos acesso antecipado para testar futuros modelos de ponta antes do lançamento.

A Anthropic não está sozinha nessa posição.

Poucos dias antes, a OpenAI havia apresentado uma prévia do GPT-5.6 a um grupo restrito, aprovado pelo governo, em vez de liberá-lo ao público, citando o mesmo dilema de uso duplo: um modelo bom o bastante para ajudar defensores a corrigir bugs também é bom o bastante para ajudar invasores a encontrá-los.

O risco não é hipotético.

No início desta primavera no hemisfério norte, a Anthropic testou uma versão anterior do Mythos que encontrou e explorou zero-day em todos os principais sistemas operacionais e navegadores sob comando, inclusive uma falha de 27 anos no OpenBSD.

Sua equipe de red team transformou bugs recém-divulgados em exploits funcionais em menos de um dia.

A crise imediata passou.

A questão maior, não.

Uma ordem executiva de 2 de junho criou uma via voluntária para que empresas submetam modelos de fronteira a revisão antes do lançamento.

Ela também instituiu um critério sigiloso para definir quais modelos entram na categoria de “cobertos”, mas descartou qualquer licença obrigatória para colocá-los no mercado.

O Fable 5 nunca passou por esse processo.

O governo recorreu aos controles de exportação.

Isso diz muito: quando Washington quer agir rápido sobre um modelo de fronteira, ainda não tem um procedimento vinculante, apenas soluções improvisadas.

Anuncie no CaveiraTech e coloque sua marca na frente de milhares de profissionais de cybersecurity

Nossa audiência é formada por analistas, pentesters, decisores e entusiastas que consomem nossas notícias todo dia pelo Site, Newsletter e Instagram. Fale com quem realmente importa para o seu negócio. Anuncie aqui. Saiba mais...

As principais notícias de cybersecurity para serem lidas em menos de 3 minutos, todo dia em seu e-mail.

Anthropic restabelece Claude Fable 5 após fim de restrições dos EUA ligadas a jailbreak

1 de Julho de 2026

As principais notícias de cybersecurity para serem lidas em menos de 3 minutos, todo dia em seu e-mail.

Anthropic restabelece Claude Fable 5 após fim de restrições dos EUA ligadas a jailbreak 1 de Julho de 2026

Anthropic restabelece Claude Fable 5 após fim de restrições dos EUA ligadas a jailbreak

1 de Julho de 2026