OpenAI lança Aardvark: agente GPT-5 que detecta e corrige falhas em código automaticamente
31 de Outubro de 2025

A OpenAI anunciou o lançamento do Aardvark, um "agentic security researcher" impulsionado pelo modelo de linguagem GPT-5, projetado para simular um especialista humano capaz de escanear, compreender e aplicar patches em códigos de forma autônoma.

O agente foi desenvolvido para auxiliar desenvolvedores e equipes de segurança na identificação e correção de vulnerabilidades em larga escala.

Atualmente, o Aardvark está disponível em versão beta privada.

Segundo a OpenAI, o Aardvark analisa continuamente repositórios de código-fonte para detectar vulnerabilidades, avaliar a possibilidade de exploits, priorizar a gravidade dos problemas e sugerir correções específicas.

Ele se integra diretamente ao pipeline de desenvolvimento, monitorando commits e alterações nas bases de código, identificando falhas de segurança e potenciais vetores de ataque, além de propor soluções fundamentadas no raciocínio do LLM e no uso de ferramentas.

No coração do Aardvark está o GPT-5, lançado pela OpenAI em agosto de 2025.

Esse modelo é apresentado como "inteligente e eficiente", com capacidade aprimorada de raciocínio por meio do GPT-5 thinking e um “real-time router” que seleciona automaticamente o modelo ideal para cada tipo de conversa, considerando a complexidade e a intenção do usuário.

O Aardvark cria um modelo de ameaças para cada projeto, alinhado aos seus objetivos de segurança e arquitetura, a partir da análise do código.

Em seguida, vasculha o histórico para identificar problemas já existentes e examina alterações recentes em busca de novas vulnerabilidades.

Quando uma possível falha é detectada, o agente realiza testes em ambiente isolado – sandbox – para confirmar se a vulnerabilidade pode ser explorada.

Depois, utiliza o OpenAI Codex para gerar um patch que pode ser revisado por um analista humano.

A OpenAI informou que o Aardvark já está sendo aplicado em seus próprios repositórios internos e em projetos de parceiros em fase alfa, ajudando a identificar pelo menos 10 CVEs em projetos open-source.

Vale destacar que outras empresas também estão explorando agentes de IA para automação na busca e correção de vulnerabilidades.

No início deste mês, o Google anunciou o CodeMender, ferramenta que detecta, corrige e reescreve códigos vulneráveis para impedir futuros exploits, com planos de colaborar com mantenedores de projetos essenciais open-source para integrar os patches gerados.

Nesse contexto, Aardvark, CodeMender e ferramentas como o XBOW surgem como soluções para análise contínua de código, validação de exploits e geração automatizada de correções.

Essa oferta vem logo após o lançamento dos modelos gpt-oss-safeguard pela OpenAI, focados em tarefas de classificação de segurança.

“Aardvark representa um novo modelo focado na defesa proativa: um agente de segurança autônomo que atua em parceria com equipes, oferecendo proteção contínua à medida que o código evolui”, disse a OpenAI.

“Ao identificar vulnerabilidades precocemente, validar sua explorabilidade no mundo real e sugerir correções claras, o Aardvark pode reforçar a segurança sem comprometer a inovação. Nossa missão é ampliar o acesso à expertise em segurança.”

Publicidade

Traçamos um caminho para você ir do zero ao avançado em hacking

Conheça a Solyd One, e tenha acesso a todos os cursos de segurança ofensiva da Solyd, todas as certificações práticas, incluindo a SYCP, 2 CTFs anuais com prêmios de até 30 mil reais, dezenas de laboratórios realísticos, suporte, comunidade e muito mais. Saiba mais...