O cenário da segurança digital acaba de entrar em uma nova era de urgência. O Instituto de Segurança de IA do Reino Unido (AISI) publicou uma avaliação impactante que coloca o GPT-5.5 da OpenAI em pé de igualdade com o Claude Mythos Preview da Anthropic em tarefas cibernéticas de nível especialista.
O dado que deveria estar em todas as mesas de diretoria hoje é este:
Em uma simulação de ataque a uma rede corporativa que levaria cerca de 20 horas para um especialista humano, o GPT-5.5 concluiu o desafio em menos de 11 minutos, a um custo irrisório de US$ 1,73. 📉💸
O que o relatório da AISI nos revela:
🔹 Capacidade de Elite: O GPT-5.5 atingiu 71,4% de aprovação em tarefas complexas como quebra de algoritmos criptográficos e engenharia reversa, superando os 68,6% do Mythos.
🔹 Uma Tendência Global: A alta capacidade ofensiva não é mais um “ponto fora da curva” de um único laboratório, mas uma tendência clara no desenvolvimento de modelos de fronteira.
🔹 Autonomia Preocupante: O modelo foi capaz de realizar roubo de credenciais, movimentação lateral e ataques à cadeia de suprimentos (CI/CD) de ponta a ponta.
Estratégias Divergentes:
Enquanto a Anthropic mantém o Mythos sob acesso restritíssimo através do Project Glasswing, a OpenAI optou pelo lançamento público do GPT-5.5 em 23 de abril, confiando em suas camadas de segurança. No entanto, Sam Altman já anunciou o GPT-5.5-Cyber, uma versão dedicada exclusivamente a “defensores de confiança”.
O alerta do AISI é claro: se o raciocínio autônomo continua evoluindo, as capacidades cibernéticas dos modelos aumentarão em rápida sucessão. O “dia zero” pode se tornar uma rotina automatizada.
A pergunta para líderes de TI e CISO’s não é mais se a IA será usada para ataques, mas se a sua defesa consegue reagir na velocidade de 11 minutos.
💭 Você acredita que a abertura desses modelos ao público é um risco aceitável para acelerar a defesa, ou deveríamos seguir o modelo de restrição total da Anthropic?

