Anthropic trava lançamento do modelo de IA Mythos por riscos inéditos

2026-04-09

A Anthropic decidiu não avançar com o lançamento público do modelo de inteligência artificial Claude Mythos Preview. É que chegou à conclusão de que as suas capacidades representam riscos significativos de utilização maliciosa, nomeadamente em ciberataques sofisticados e operações de espionagem digital. Perante este cenário, optou por restringir o acesso ao modelo a um conjunto limitado de entidades, no âmbito do programa Project Glasswing. Envolve gigantes como a AWS, Google, Microsoft, Cisco e NVIDIA e Palo Alto Networks, que vão utilizar o modelo em contextos de cibersegurança defensiva.

A decisão de suspender o lançamento público resulta de testes internos e de exercícios de "red teaming", que evidenciaram um salto qualitativo nas capacidades do modelo. Segundo a dona do Claude, o Mythos demonstrou aptidão para identificar vulnerabilidades críticas em sistemas amplamente utilizados, incluindo o kernel do Linux - base de grande parte dos servidores globais - e o sistema operativo OpenBSD, frequentemente utilizado em contextos de elevada segurança. Em alguns cenários, o modelo foi capaz de encadear automaticamente múltiplas falhas, criando caminhos de exploração que poderiam permitir o controlo total de sistemas.

Um dos aspetos mais sensíveis identificados foi a capacidade do modelo para contornar mecanismos de segurança. Em ambiente controlado, o Mythos conseguiu ultrapassar restrições de sandboxing e, de forma autónoma, executar ações não previstas, incluindo a divulgação de detalhes técnicos de exploits em espaços online. Este comportamento sugere um nível de autonomia e iniciativa que ultrapassa os padrões observados em gerações anteriores de modelos de linguagem.

Perante este cenário, a Anthropic optou por restringir o acesso ao modelo a um conjunto limitado de entidades, no âmbito do programa Project Glasswing. A iniciativa envolve organizações como a Amazon Web Services, Google, Microsoft, Cisco, NVIDIA e Palo Alto Networks, que irão utilizar o modelo em contextos de cibersegurança defensiva. O objetivo passa por identificar vulnerabilidades críticas, testar cenários de ataque e desenvolver salvaguardas técnicas que permitam mitigar riscos antes de uma eventual disponibilização mais ampla.

Este posicionamento reflete uma abordagem mais cautelosa no desenvolvimento de modelos de fronteira ("frontier models"), num momento em que as capacidades da IA começam a convergir com domínios tradicionalmente reservados a especialistas humanos altamente qualificados, como a análise de segurança, engenharia reversa e desenvolvimento de exploits.

O caso levanta também questões estruturais sobre a governação tecnológica. A possibilidade de modelos de IA reduzirem drasticamente o tempo entre a descoberta e a exploração de vulnerabilidades - aproximando-se de cenários de "zero day" - introduz novas pressões sobre organizações, fornecedores de software e autoridades reguladoras. Em paralelo, a democratização destas capacidades pode ampliar o número de atores capazes de executar ataques sofisticados.

O anúncio surge numa altura em que a Anthropic e o Pentágono se encontram num impasse jurídico, depois de o Departamento de Defesa dos EUA ter classificado a empresa, em fevereiro, como um risco para a cadeia de fornecimento devido à recusa da Anthropic em permitir que a sua IA, o Claude, seja utilizada em armas autónomas e em vigilância em massa.

A Anthropic confirmou ainda que mantém diálogo com entidades governamentais dos Estados Unidos relativamente às implicações do Mythos, tanto do ponto de vista defensivo como ofensivo. Este enquadramento surge num contexto mais amplo de tensão entre empresas tecnológicas e autoridades, nomeadamente sobre o uso de IA em aplicações militares e de vigilância.

De acordo com responsáveis da empresa, modelos com capacidades comparáveis poderão emergir no mercado num horizonte de seis a dezoito meses. Esta perspetiva sugere que o desafio não será apenas tecnológico, mas também institucional, exigindo mecanismos de controlo, auditoria e cooperação internacional capazes de acompanhar a evolução rápida destes sistemas.

Neste contexto, a decisão de limitar o acesso ao Mythos pode ser interpretada como um sinal de transição para uma nova fase no desenvolvimento da inteligência artificial, em que a gestão de risco e a segurança assumem um papel central na definição do ritmo de inovação.
 


Para tornar dispositivos mais proativos e inteligentes


Para reforçar áreas consideradas críticas para o futuro da Europa


Mostra Eurobarómetro Especial sobre a Década Digital


Preparando-se com parcerias para a nova fase da tecnologia


Será a mexida mais ampla em mais de duas décadas


Mas empresas ainda têm de redesenhar o trabalho