secondo la Università di Cornell ( pagina ufficiale: https://www.cornell.edu/) in un recente test fatto con le varie AI come GPT-3.5, LLaMA-2 è risultato che alcune AI sono in grado di scoprire le vulnerabilità dei siti web fisici, tutto è stato reso pubblico con la pubblicazione della ricerca titolata LLM Agents can Autonomously Hack Websites.

L’IA che ha avuto più risultati è stata GPT-4 sfruttata appunto da questi agenti LLM per attaccare una pagina web automaticamente e ancora più spaventoso in modo anonimo infatti attraverso esempi di attacchi, come l’ SQL Injection, si è osservato che queste intelligenze artificiali possono navigare autonomamente i siti web, utilizzare credenziali standard in tentativi di accesso e, di fronte a insuccessi, applicare tecniche di hacking più sofisticate.

Esecuzione dell’attacco

in breve ciò che viene detto è come un attacco specifico viene eseguito da un agente LLM (in totale anonimia) seguendo 3 step precisi:

  • Scelta della Pagina Target: l’agente identifica la pagina web su cui concentrare l’attacco.
  • Tentativi con Credenziali di Default: l’agente prova combinazioni comuni come “admin” per username e password.
  • Esecuzione di un SQL Injection Classico: in caso di fallimento delle credenziali standard, l’agente tenta di sfruttare vulnerabilità con comandi SQL come “OR 1 = 1”, un classico espediente per bypassare l’autenticazione.

ciò evidenzia l’abilità dell’agente LLM di navigare un sito web in autonomia, identificando potenziali vulnerabilità e tentando un attacco SQL Injection senza alcun intervento o conoscenza preventiva specifica. Ciò che sappiamo è che c’è stato l’ausilio di piattaforme avanzate come LangChain, esse consento a questi agenti di compiere azioni in modo autonomo, di manipolare browser web, di interpretare documenti

Questo processo è facilitato dall’API OpenAI Assistants, integrata nei modelli GPT. Fornisce agli agenti gli strumenti necessari per operare in modo autonomo, consente loro di basare le proprie decisioni sugli input ricevuti e permette loro di interfacciarsi con strumenti e API per navigare tra gli argomenti rilevanti. Utilizzando le loro capacità di lettura e interpretazione dei documenti, di pianificazione delle azioni in base al feedback e di interazione con le API, gli agenti LLM possono operare in questo ambiente senza bisogno di una supervisione diretta.


Il tasso di successo di diversi agenti LLM e framework negli attacchi autonomi ai siti web è evidenziato nella sezione “Hacking Websites” del documento. GPT-4 si distingue con un tasso di successo fino al 73,3%. Il fatto che GPT-4 sia in grado di lanciare attacchi tramite la scansione di documenti e l’utilizzo di API, invece di richiedere una programmazione speciale per sfruttare le falle, suggerisce un notevole miglioramento rispetto alle versioni precedenti.