Novidades

Claude Fable 5: o benchmark que virou manchete e a política de dados que vai impactar o seu contrato

Claude Fable 5 chegou com 80,3% no SWE-Bench Pro. O que poucos estão lendo: a nova política de 30 dias de retenção que afeta contratos enterprise com zero-retention.

Rafael Duarte

EDITOR TÉCNICO

Publicado

09 de jun. de 2026

Leitura

8 min

09 de jun. de 2026 · 8 MIN

COVER · Novidades

Se você tem um contrato enterprise com a Anthropic que incluía zero-retention — onde os dados não ficam armazenados do lado deles — esse contrato mudou hoje. Antes de habilitar o Claude Fable 5 na sua organização, o administrador precisa reconhecer explicitamente uma nova política de retenção de 30 dias. Não é opt-in silencioso, mas também não é negociável.

Isso é o que importa no lançamento de hoje. Não o benchmark.

Fable 5 e Mythos 5 são o mesmo modelo, dividido em dois

A Anthropic lançou dois modelos hoje, 9 de junho de 2026: Claude Fable 5 e Claude Mythos 5. O detalhe que a maioria das notícias passou por cima: são o mesmo modelo subjacente. A diferença está nos classificadores de segurança aplicados por cima.

Fable 5 é a versão com safeguards ativos, disponível para o público geral via API e nos planos Pro, Max, Team e Enterprise. Mythos 5 é o mesmo modelo com os safeguards parcialmente desativados — disponível para aproximadamente 50 parceiros selecionados, incluindo o governo americano, pelo que a Anthropic chamou de Project Glasswing.

A lógica é direta: a Anthropic chegou à conclusão de que não poderia liberar o Mythos sem restrições. A solução foi criar uma versão pública com classificadores que interceptam queries de alto risco. Você acessa o mesmo poder computacional, mas com uma camada de filtragem que a empresa controla.

O que os classificadores fazem na prática

Quando você faz uma query sensível nas áreas de cibersegurança, biologia ou química, o Fable 5 não responde diretamente. O classificador intercepta, redireciona a query para o Claude Opus 4.8, e você recebe uma resposta desse modelo — sem notificação explícita de que isso aconteceu.

Para a maioria dos casos de uso enterprise isso é invisível. Se você está usando a API para geração de código, análise de documentos, sumarização ou workloads de automação padrão, vai interagir com o Fable 5 completo. O redirecionamento só entra quando a query toca nas categorias específicas que a Anthropic definiu como alto risco.

O problema potencial é rastreabilidade. Se seu sistema tem logging de qual modelo respondeu cada request e você começa a ver respostas do Opus 4.8 entrando, isso pode confundir o seu pipeline de monitoramento. Não é um bug — é o comportamento projetado. Mas é um comportamento que vale documentar antes de ligar o modelo em produção.

A retenção de 30 dias: o que mudou para contratos enterprise

Esse é o ponto que os releases focados em benchmark não estão cobrindo.

Com o Fable 5, a Anthropic impõe 30 dias de retenção de dados em todo o tráfego, incluindo clientes enterprise que anteriormente tinham acordos de zero-retention. A empresa afirma que os dados não são usados para treinamento — a retenção serve exclusivamente para defesa contra novos vetores de ataque e jailbreak, e para reduzir falsos positivos nos classificadores.

Se você é advogado corporativo ou CISO, "não usamos para treinamento" não resolve automaticamente o problema de compliance. Dependendo do setor — saúde, jurídico, financeiro — 30 dias de retenção em servidores de terceiros pode conflitar com obrigações contratuais com clientes ou com regulamentações setoriais. O GDPR europeu, a LGPD e contratos com cláusula de dado exclusivo precisam ser revisados antes de migrar workloads para o Fable 5.

A Anthropic fez isso ser opt-in a nível de organização: um administrador precisa habilitar o Fable 5 e aceitar explicitamente a nova política antes que os usuários da organização possam acessá-lo. Para o enterprise com zero-retention anterior, essa aceitação representa uma mudança material nos termos do serviço.

Não estou dizendo que é errado — provavelmente é o preço real de tornar público um modelo Mythos-class. Mas é uma decisão que precisa ser revisada juridicamente, não só tecnicamente.

Preço: o que $10/$50 sinaliza

Claude Fable 5 custa $10 por milhão de tokens de input e $50 por milhão de tokens de output. O Claude Opus 4.8 custa $5/$25 — metade disso. O Mythos Preview, que existia antes, custava mais que o dobro do Fable 5.

A estrutura de preço faz sentido como posicionamento: Fable 5 é o novo topo da linha pública, abaixo do acesso fechado ao Mythos completo. Para quem estava usando o Opus 4.8 como modelo de produção pesado, Fable 5 duplica o custo por token. Para quem queria Mythos e não conseguia acesso, Fable 5 entra bem abaixo do preço anterior.

Um detalhe que afeta workloads agentic: há um desconto de 90% em prompt caching para tokens de input repetidos. Em aplicações que reenviam contextos estáveis longos — agentes com prompts de sistema extensos, ferramentas de RAG com chunks fixos — o custo efetivo de input cai bastante. Em workloads de alta repetição de contexto, o Fable 5 pode sair mais barato que o Opus 4.8 na prática, dependendo do ratio input/output.

O acesso nos planos pagos (Pro, Max, Team, Enterprise) é gratuito até 22 de junho. Depois migra para créditos de uso.

O que o benchmark 80,3% no SWE-Bench Pro significa

Fable 5 acertou 80,3% no SWE-Bench Pro. GPT-5.5 ficou em 58,6%. Gemini 3.1 Pro, em 54,2%. No FrontierCode Diamond, Fable 5 foi para 29,3% contra 5,7% do GPT-5.5.

Esses números são impressionantes. Também são números de benchmark, não de produção.

O SWE-Bench Pro avalia a capacidade do modelo de resolver issues reais do GitHub — um setup controlado com contexto fornecido, critérios de sucesso definidos, e sem as restrições de tempo real e imprevisibilidade de um ambiente de CI/CD vivo. A notícia do caso Stripe — migração de codebase de 50 milhões de linhas de Ruby em um dia — é mais reveladora, mas também é um anedota de caso de uso específico onde a Anthropic tinha controle das condições de operação.

80,3% no benchmark significa que o modelo é genuinamente muito bom em tarefas de engenharia de software estruturadas. Significa também que para avaliar o impacto real no seu fluxo de trabalho específico, você vai precisar testar com os seus próprios casos, não com os casos do benchmark. A lacuna entre benchmark e produção ainda existe para todos os modelos.

O IPO como contexto

A Anthropic fechou uma rodada Series H de $65 bilhões a uma avaliação de $965 bilhões e depositou confidencialmente o pedido de IPO. O lançamento do Fable 5 hoje não é coincidência de calendário.

Isso importa para quem está considerando apostar fortemente na API da Anthropic como infraestrutura de produto. Empresas de capital aberto têm dinâmicas diferentes de empresas privadas: pressão de resultado trimestral, stakeholders com prioridades heterogêneas, e uma relação diferente com mudanças de preço e de termos de serviço.

A mudança na política de retenção de dados — implementada junto com o primeiro grande lançamento público pré-IPO — é um dado. Não é definitivo, mas é um dado sobre como a empresa vai operar em escala sob pressão de crescimento. Vale monitorar os próximos movimentos de pricing e de termos com atenção.

O que fazer com isso agora

Se você usa a API da Anthropic em produção:

Antes de habilitar o Fable 5: revise o impacto da retenção de 30 dias com o time jurídico ou de compliance, especialmente se atende setores regulados ou tem contratos com cláusulas de dado exclusivo.

Se o modelo está no fluxo: adicione logging explícito do campo model na resposta da API. Isso vai expor se e quando o classificador está redirecionando para Opus 4.8, evitando confusão em pipelines de monitoramento.

Se está avaliando migrar do Opus 4.8: calcule o custo real incluindo prompt caching. Para workloads agentic com contexto estável, o custo efetivo pode ser mais próximo do Opus 4.8 do que a comparação direta de token price sugere.

O Fable 5 é o modelo mais capaz que a Anthropic já disponibilizou publicamente. A pergunta não é se vale usar — vale avaliar. A pergunta é o que você precisa resolver antes de colocar em produção de forma responsável.

Nota: o conteúdo editorial acabou aqui. O que vem abaixo é uma indicação de ferramenta relacionada ao tema do post.

Ferramenta relacionada

Se você está construindo ou testando pipelines com a API do Claude, manter os prompts organizados e o JSON das respostas legível faz parte do trabalho. O JSON Formatter do Quick Tools formata e valida respostas de API diretamente no browser, sem precisar instalar nada localmente.

Autor

Rafael Duarte

Desenvolvedor backend com passagem por fintech e SaaS B2B — trabalhou em times que escalaram APIs de zero a milhões de requisições. Carrega cicatrizes de produção suficientes para ter opiniões fortes sobre ferramentas, padrões e decisões de arquitetura. Não é acadêmico: leu a RFC do UUID quando precisou escolher entre v4 e v7 para uma tabela de alta escrita.

Ver perfil