Após o Mythos da Anthropic, a OpenAI lança novo modelo de cybersecurity e estratégia própria
17 de Abril de 2026

A OpenAI anunciou nesta terça-feira, 5, a próxima fase de sua estratégia de cibersegurança e um novo modelo desenvolvido especificamente para uso por defensores digitais, o GPT-5.4-Cyber.

O movimento ocorre poucos dias depois de a concorrente Anthropic divulgar o Claude Mythos Preview, um modelo que, por enquanto, está sendo liberado apenas de forma privada.

Segundo a empresa, a decisão foi tomada porque a tecnologia poderia ser explorada por hackers e outros agentes maliciosos.

A Anthropic também anunciou uma coalizão do setor, com nomes como a Google, para discutir como os avanços da IA generativa vão impactar a cibersegurança.

Na terça-feira, a OpenAI buscou diferenciar sua mensagem com um tom menos alarmista, destacando as proteções e salvaguardas já existentes, mas também sinalizando a necessidade de mecanismos mais avançados no futuro.

“Acreditamos que as salvaguardas atualmente em uso reduzem suficientemente o risco cibernético para viabilizar a ampla adoção dos modelos atuais”, escreveu a empresa em um post no blog.

“Esperamos que versões dessas salvaguardas sejam suficientes para modelos mais poderosos que estão por vir, enquanto modelos treinados explicitamente e com permissões ampliadas para atuação em cibersegurança exigirão implantações mais restritivas e controles adequados.

No longo prazo, para garantir que a segurança da IA continue adequada no contexto da cibersegurança, também prevemos a necessidade de defesas mais abrangentes para modelos futuros, cujas capacidades superarão rapidamente até os melhores modelos especializados de hoje.”

Segundo a OpenAI, sua abordagem de cibersegurança se apoia em três pilares.

O primeiro envolve sistemas de validação no modelo “conheça seu cliente” (KYC), criados para permitir acesso controlado a novos modelos de forma ampla e, nas palavras da empresa, “democratizada”.

“Nós projetamos mecanismos que evitam decidir arbitrariamente quem deve ou não ter acesso para usos legítimos”, afirmou a companhia.

A OpenAI combina um modelo de parceria com organizações selecionadas em lançamentos limitados com um sistema automatizado introduzido em fevereiro, chamado Trusted Access for Cyber (TAC).

O segundo pilar é a chamada “implantação iterativa”, um processo de liberação cuidadosa de novas capacidades, seguido de ajustes com base no uso real.

No blog, a empresa destaca especialmente a necessidade de fortalecer a resiliência contra jailbreaks e outros ataques adversariais, além de aprimorar as capacidades defensivas.

O terceiro foco está em investimentos que, segundo a OpenAI, sustentam a segurança de software e outras frentes de defesa digital à medida que a IA generativa se dissemina.

A empresa afirma que a iniciativa faz parte de um esforço mais amplo de segurança, que inclui o agente de IA para segurança de aplicações lançado no mês passado, o Codex Security, um programa de subsídios em cibersegurança iniciado em 2023, uma doação recente à Linux Foundation para apoiar a segurança de software de código aberto e o Preparedness Framework, criado para avaliar e conter danos graves decorrentes de capacidades avançadas de IA.

As declarações da Anthropic na semana passada, de que modelos mais capazes exigem uma revisão profunda na cibersegurança, geraram controvérsia entre especialistas da área.

Alguns avaliam que a preocupação é exagerada e pode alimentar uma nova onda de discurso anti-hacker, concentrando ainda mais poder nas big techs.

Outros, porém, ressaltam que falhas e limitações das defesas atuais são bem conhecidas e podem, de fato, ser exploradas com muito mais velocidade e intensidade por um número maior de agentes maliciosos na era da IA orientada a agentes.

Publicidade

Traçamos um caminho para você ir do zero ao avançado em hacking

Conheça a Solyd One, e tenha acesso a todos os cursos de segurança ofensiva da Solyd, todas as certificações práticas, incluindo a SYCP, 2 CTFs anuais com prêmios de até 30 mil reais, dezenas de laboratórios realísticos, suporte, comunidade e muito mais. Saiba mais...