A OpenAI anunciou o lançamento do Aardvark, um "agentic security researcher" impulsionado pelo modelo de linguagem GPT-5, projetado para simular um especialista humano capaz de escanear, compreender e aplicar patches em códigos de forma autônoma.
O agente foi desenvolvido para auxiliar desenvolvedores e equipes de segurança na identificação e correção de vulnerabilidades em larga escala.
Atualmente, o Aardvark está disponível em versão beta privada.
Segundo a OpenAI, o Aardvark analisa continuamente repositórios de código-fonte para detectar vulnerabilidades, avaliar a possibilidade de exploits, priorizar a gravidade dos problemas e sugerir correções específicas.
Ele se integra diretamente ao pipeline de desenvolvimento, monitorando commits e alterações nas bases de código, identificando falhas de segurança e potenciais vetores de ataque, além de propor soluções fundamentadas no raciocínio do LLM e no uso de ferramentas.
No coração do Aardvark está o GPT-5, lançado pela OpenAI em agosto de 2025.
Esse modelo é apresentado como "inteligente e eficiente", com capacidade aprimorada de raciocínio por meio do GPT-5 thinking e um “real-time router” que seleciona automaticamente o modelo ideal para cada tipo de conversa, considerando a complexidade e a intenção do usuário.
O Aardvark cria um modelo de ameaças para cada projeto, alinhado aos seus objetivos de segurança e arquitetura, a partir da análise do código.
Em seguida, vasculha o histórico para identificar problemas já existentes e examina alterações recentes em busca de novas vulnerabilidades.
Quando uma possível falha é detectada, o agente realiza testes em ambiente isolado – sandbox – para confirmar se a vulnerabilidade pode ser explorada.
Depois, utiliza o OpenAI Codex para gerar um patch que pode ser revisado por um analista humano.
A OpenAI informou que o Aardvark já está sendo aplicado em seus próprios repositórios internos e em projetos de parceiros em fase alfa, ajudando a identificar pelo menos 10 CVEs em projetos open-source.
Vale destacar que outras empresas também estão explorando agentes de IA para automação na busca e correção de vulnerabilidades.
No início deste mês, o Google anunciou o CodeMender, ferramenta que detecta, corrige e reescreve códigos vulneráveis para impedir futuros exploits, com planos de colaborar com mantenedores de projetos essenciais open-source para integrar os patches gerados.
Nesse contexto, Aardvark, CodeMender e ferramentas como o XBOW surgem como soluções para análise contínua de código, validação de exploits e geração automatizada de correções.
Essa oferta vem logo após o lançamento dos modelos gpt-oss-safeguard pela OpenAI, focados em tarefas de classificação de segurança.
“Aardvark representa um novo modelo focado na defesa proativa: um agente de segurança autônomo que atua em parceria com equipes, oferecendo proteção contínua à medida que o código evolui”, disse a OpenAI.
“Ao identificar vulnerabilidades precocemente, validar sua explorabilidade no mundo real e sugerir correções claras, o Aardvark pode reforçar a segurança sem comprometer a inovação. Nossa missão é ampliar o acesso à expertise em segurança.”
Publicidade
Conheça a Solyd One, e tenha acesso a todos os cursos de segurança ofensiva da Solyd, todas as certificações práticas, incluindo a SYCP, 2 CTFs anuais com prêmios de até 30 mil reais, dezenas de laboratórios realísticos, suporte, comunidade e muito mais. Saiba mais...