← Blog

O Que É o Claude Mythos? Vazamento, Nível Capybara e O Que a Anthropic Confirmou

O Claude Mythos é o modelo de próxima geração da Anthropic que vazou. Veja o que a violação de dados revelou e o que a empresa confirmou oficialmente.

11 min read
O Que É o Claude Mythos? Vazamento, Nível Capybara e O Que a Anthropic Confirmou

Estava percorrendo meu feed de manhã quando uma manchete da Fortune me parou completamente: a Anthropic havia acidentalmente deixado quase 3.000 arquivos internos em um armazenamento de dados pesquisável publicamente — incluindo um rascunho de post de blog anunciando seu próximo modelo. Quando cliquei, a história já havia se espalhado amplamente. O nome do modelo: ​Claude Mythos​. O nome de tier interno associado a ele: ​Capybara​. E o próprio rascunho da Anthropic o chamava de “de longe o modelo de IA mais poderoso que já desenvolvemos.”

Sou a Dora. Este artigo é um resumo factual para desenvolvedores e líderes de produtos de IA que precisam de uma leitura objetiva sobre o que foi realmente confirmado, o que veio do rascunho vazado e o que permanece desconhecido. Ainda não há números oficiais de benchmark para citar — e não vou inventar nenhum.

O Que o Vazamento de Dados do Claude Mythos Realmente Revelou

Quem Encontrou e Como

O vazamento se originou de um erro de configuração no sistema de gerenciamento de conteúdo da Anthropic. A configuração incorreta do CMS deixou cerca de 3.000 ativos não publicados em um armazenamento de dados acessível e pesquisável publicamente. Dois pesquisadores de segurança localizaram o material exposto de forma independente: Roy Paz da LayerX Security e Alexandre Pauwels da Universidade de Cambridge descobriram o armazenamento de dados exposto, que continha um rascunho de post de blog descrevendo o modelo em detalhes. A Fortune revisou os documentos e notificou a Anthropic, após o que o acesso foi restringido.

A Anthropic atribuiu o incidente a “erro humano” na configuração do CMS e descreveu o material exposto como “rascunhos iniciais de conteúdo considerados para publicação.” Um segundo vazamento separado ocorreu dias depois: a Anthropic acidentalmente carregou todo o código-fonte original do Claude Code no NPM em vez de apenas a versão compilada, expondo cerca de 500.000 linhas de código em aproximadamente 1.900 arquivos. Esse segundo vazamento forneceu corroboração adicional de que o modelo Capybara estava ativamente em preparação.

O Que Estava no Rascunho Exposto

Havia na verdade duas versões do mesmo post de blog que diferiam apenas no nome do modelo: “Mythos” (v1) e “Capybara” (v2). Na versão Capybara, o nome foi trocado em todo o título e corpo do texto, mas o subtítulo ainda lê: “Terminamos o treinamento de um novo modelo de IA: Claude Mythos.” A Anthropic disse à Fortune que os documentos eram “rascunhos iniciais de conteúdo que estavam sendo considerados para publicação,” sugerindo que a empresa ainda estava decidindo entre candidatos de nomes para o mesmo modelo.

O rascunho também delineou uma estratégia de lançamento. De acordo com os documentos, a Anthropic está planejando um lançamento deliberadamente mais lento do que com modelos anteriores, começando com um pequeno grupo de clientes de acesso antecipado encarregados de avaliar aplicações de segurança cibernética, com acesso através da API Claude se expandindo gradualmente. O rascunho também reconheceu que o modelo é “muito caro de servir” e que a Anthropic está trabalhando para torná-lo “muito mais eficiente antes de qualquer lançamento geral.”

Claude Mythos vs Capybara — Mesmo Modelo, Dois Nomes

O Que Capybara Significa como um Novo Tier

Este é o ponto estrutural mais importante a se acertar. Mythos e Capybara não são dois modelos diferentes. “Claude Mythos” é o nome do produto/geração (como “Claude 4”), enquanto “Capybara” é o nome do tier (como Haiku, Sonnet, Opus). A designação completa seria algo como “Claude Mythos Capybara.”

A distinção de tier importa porque representa uma mudança na arquitetura da linha de modelos da Anthropic. Atualmente, os tiers de modelos da Anthropic vão do Haiku (menor, mais rápido, mais barato) passando pelo Sonnet até o Opus (mais capaz). Capybara adicionaria um quarto tier, mais caro, acima de todos os três — “maior e mais inteligente do que nossos modelos Opus — que eram, até agora, nossos mais poderosos,” de acordo com o rascunho vazado.

Esta é uma expansão estrutural, não apenas um incremento de versão. Pense nisto menos como “Opus 5” e mais como uma nova categoria de produto que fica acima da linha existente.

Como a Nomenclatura Pode Evoluir Antes do Lançamento Público

Ambas as versões do rascunho usam a mesma justificativa para o nome, dizendo que foi escolhido para evocar “o tecido conjuntivo profundo que une conhecimento e ideias.” Se o modelo será lançado como “Claude Mythos,” “Claude Capybara,” ou sob um nome público completamente diferente ainda não foi confirmado. O fato de que dois rascunhos existem — um chamado Mythos, um chamado Capybara — sinaliza que isso ainda estava em aberto no momento do vazamento.

“Claude Mythos 5” não é um nome oficial. Ele circulou na cobertura como abreviação, mas não aparece nos documentos vazados nem em nenhuma declaração da Anthropic. Não o trate como uma designação confirmada.

Capacidades Alegadas vs Claude Opus 4.6

Todas as alegações de capacidade abaixo se originam do rascunho de post de blog vazado e são atribuídas de acordo. Nenhum benchmark oficial foi publicado pela Anthropic até abril de 2026.

Codificação e Raciocínio Agêntico

De acordo com o rascunho vazado, “Comparado ao nosso melhor modelo anterior, Claude Opus 4.6, Capybara obtém pontuações dramaticamente mais altas em testes de codificação de software, raciocínio acadêmico e segurança cibernética, entre outros.” O rascunho não fornece números específicos de benchmark — apenas o descritor qualitativo “dramaticamente mais altas.” Ainda não existe reprodução externa dessas pontuações.

A alegação de raciocínio agêntico melhorado é consistente com a trajetória da família de modelos Claude existente, que tem progressivamente estendido o uso de ferramentas e o tratamento de tarefas em múltiplas etapas. A rápida adoção corporativa do Claude Code já foi construída sobre as capacidades agênticas do Opus 4.6; Mythos presumivelmente estenderia isso ainda mais.

Melhorias no Raciocínio Acadêmico

O rascunho vazado lista o raciocínio acadêmico como uma das áreas de desempenho “dramaticamente mais alto” em relação ao Opus 4.6. Nenhum detalhe sobre quais benchmarks (GPQA, MMLU, MATH, etc.) ou quais faixas de pontuação foram alegadas surgiu em reportagens verificadas. Esta é uma área onde a ausência de números oficiais importa: tomar decisões com base em alegações de benchmark não verificadas de um documento de rascunho carrega risco real de avaliação.

Desempenho em Segurança Cibernética — e Por Que Está Causando Preocupação

É aqui que o vazamento gerou mais discussão — e mais cautela. O rascunho vazado afirmou que o modelo “presagia uma onda iminente de modelos que podem explorar vulnerabilidades de maneiras que superam em muito os esforços dos defensores.”

Os documentos vazados descrevem Mythos como atualmente muito à frente de qualquer outro modelo de IA em capacidades cibernéticas, levantando sérias preocupações de uso dual. A própria declaração da Anthropic reconheceu o risco diretamente: “Ao nos preparar para lançar Claude Capybara, queremos agir com cautela extra e entender os riscos que ele apresenta — mesmo além do que aprendemos em nossos próprios testes.”

O contexto aqui não é abstrato. A Anthropic relatou anteriormente que um grupo patrocinado pelo estado chinês já havia executado uma campanha coordenada usando o Claude Code para se infiltrar em cerca de 30 organizações — incluindo empresas de tecnologia, instituições financeiras e agências governamentais — antes de a empresa detectá-la. As alegadas capacidades de segurança cibernética de Mythos amplificam consideravelmente esse perfil de risco de uso dual, o que é um fator direto da estratégia cautelosa de lançamento.

Para equipes que integram modelos de fronteira em ferramentas de segurança, este é um fator genuíno — não apenas linguagem regulatória. Vale a pena revisar a política de uso da Anthropic antes de construir qualquer aplicação adjacente à segurança cibernética nos modelos atuais ou futuros.

Disponibilidade Atual: Quem Pode Acessá-lo Agora

Detalhes do Programa de Acesso Antecipado

A Anthropic está trabalhando com um pequeno grupo de clientes de acesso antecipado para testar o modelo. O rascunho vazado indica que esse grupo está especificamente focado na avaliação de aplicações de segurança cibernética, sugerindo que o grupo de acesso antecipado foi selecionado com base em expertise de domínio relevante em vez de apenas tamanho do cliente.

De acordo com informações de produto vazadas destinadas a clientes de acesso antecipado, o novo modelo poderia ser usado por atores de ameaças para implementar ataques mais poderosos. O design de acesso antecipado é em parte uma avaliação de risco controlada, não apenas uma prévia de recursos.

Não há lista de espera pública, nenhum processo de inscrição anunciado e nenhum cronograma confirmado para expandir além do grupo inicial. Se você viu sites de terceiros oferecendo “acesso ao Capybara,” esses não são afiliados à Anthropic.

Nenhuma API Pública ou Data de Lançamento Confirmada

A declaração oficial da Anthropic é a única posição pública confirmada: “Estamos desenvolvendo um modelo de uso geral com avanços significativos em raciocínio, codificação e segurança cibernética. Dada a força de suas capacidades, estamos sendo deliberados sobre como o lançamos.”

Nenhum endpoint de API, nenhum preço, nenhum trimestre de lançamento. O rascunho observou que o modelo é “caro de executar” e ainda não está pronto para disponibilidade geral. Para equipes planejando roadmaps em torno deste modelo, a resposta honesta é: ainda não há data para planejar.

O Que Isso Significa para Equipes Avaliando Modelos de Fronteira

Algumas coisas que valem a reflexão se você está fazendo avaliação de modelos para decisões de produto ou infraestrutura:

A ambiguidade de nomenclatura é um problema prático. Se seu framework de avaliação faz referência a “Claude Mythos 5” ou trata Capybara como um produto público confirmado, você está construindo sobre linguagem de rascunho que a Anthropic pode mudar completamente antes do lançamento. Mantenha sua documentação interna flexível quanto à nomenclatura até que haja um lançamento oficial.

A alegação de capacidade em segurança cibernética muda o cálculo de risco para certos casos de uso. Se sua aplicação envolve varredura de vulnerabilidades, testes de penetração ou análise de segurança de código, as alegadas capacidades do Mythos aumentam tanto o potencial quanto o ônus de conformidade. Comece a avaliar isso agora em vez de depois que o acesso abrir.

Claude Opus 4.6 continua sendo a opção de nível de produção. Para equipes que precisam lançar hoje, Opus 4.6 ainda é o carro-chefe publicamente disponível da Anthropic e tem bom desempenho em tarefas de raciocínio complexo. Perseguir um modelo não lançado para projetos atuais não faz sentido. Revise a documentação atual de modelos da Anthropic para acesso à API e especificações de capacidade.

A situação de duplo vazamento é um sinal, não apenas uma história. Duas divulgações não intencionais importantes em uma semana — arquivos do CMS e código-fonte do Claude Code — sugerem que a coordenação interna de lançamento está sob pressão. O modelo pode estar mais próximo do lançamento do que uma postura pública cautelosa implica. Ou pode ser lançado significativamente mais tarde se os testes de segurança levantarem problemas. Nenhuma interpretação está errada; a incerteza é o estado real das coisas.

Perguntas Frequentes

O Claude Mythos está disponível publicamente?

Não. A partir de abril de 2026, Claude Mythos / Capybara está disponível apenas para um pequeno grupo de clientes de acesso antecipado selecionados pela Anthropic. Não há API pública, nenhum preço anunciado e nenhuma data de lançamento confirmada.

Como ele se compara ao Opus 4.6?

De acordo com o rascunho de post de blog vazado, Capybara obtém “pontuações dramaticamente mais altas” do que Claude Opus 4.6 em benchmarks de codificação de software, raciocínio acadêmico e segurança cibernética. Nenhum número específico foi publicado. Todas as comparações de capacidade atualmente vêm dessa fonte de rascunho, não de lançamentos oficiais de benchmark.

Haverá uma API pública do Claude Mythos?

Provavelmente sim em algum momento — o rascunho vazado descrevia um lançamento gradual através da API Claude — mas nenhum cronograma foi confirmado. O modelo atualmente é descrito como caro de servir e ainda não otimizado para disponibilidade geral. Monitore o canal de notícias oficial da Anthropic para anúncios.

Posts Anteriores:

Compartilhar