Vai al contenuto

Un'arma a doppio taglio all'avanguardia: classifica delle minacce legate all'IA

Sophos X-Ops presenta una classificazione operativa degli attacchi che utilizzano l'IA e che la prendono di mira

Le conversazioni sulle cosiddette "minacce dell'IA" tendono generalmente a polarizzarsi su uno di due estremi. Da un lato c'è l'enfasi eccessiva: affermazioni non verificate che non resistono a un'analisi approfondita e finiscono per attirare forti critiche. Dall'altro c'è la minimizzazione: si sostiene che si tratti semplicemente di tecniche già note, riproposte con una nuova etichetta.

Come spesso accade con questo tipo di contrapposizioni, la realtà probabilmente si colloca nel mezzo. I cybercriminali stanno utilizzando e sperimentando l'intelligenza artificiale in modi diversi, sia per facilitare gli attacchi sia prendendola direttamente di mira. Per varie ragioni è difficile comprendere con precisione la reale diffusione di questi fenomeni, ma, come abbiamo evidenziato nella nostra analisi sugli atteggiamenti nei confronti dell'IA all'interno dei forum criminali, si è osservato un progressivo incremento dell'adozione dell'intelligenza artificiale in alcuni strumenti utilizzati dagli attaccanti.

Anche altre ricerche, come il Threat Landscape Report 2025 dell'ENISA, descrivono un utilizzo graduale ma concreto dell'intelligenza artificiale nell'ecosistema della criminalità informatica, includendo phishing generato dall'IA, clonazione vocale, deepfake, scripting e attività di ricognizione assistite dall'IA. Allo stesso tempo, il rapporto evidenzia – in linea con quanto emerso anche dalle nostre ricerche – che altre applicazioni malevole, come la generazione di malware tramite IA, rimangono per il momento confinate a dimostrazioni controllate piuttosto che rappresentare una minaccia attiva.

Per contribuire al monitoraggio e alla classificazione delle minacce legate all'intelligenza artificiale, Sophos X-Ops ha sviluppato uno schema di classificazione. Questo suddivide il problema in due categorie principali: uso malevolo dell'IA (Malicious use of AI) e attacchi contro l'IA (Malicious targeting of AI). Ciascuna categoria comprende diverse sottocategorie di attacco, basate su incidenti osservati sul campo, sulle nostre attività di ricerca relative agli attacchi contro l'IA oppure su scenari che riteniamo rappresentino possibilità realistiche per il futuro.

Questo schema non intende sostituirsi ad altri lavori sviluppati in questo ambito, come MITRE ATLAS (il framework di riferimento per gli attacchi ai sistemi di IA), la tassonomia delle modalità di errore degli agenti di IA elaborata da Microsoft, l'AI Risk Repository del MIT o il documento NIST AI 100-2. Il suo obiettivo è piuttosto quello di fungere da livello preliminare di classificazione (triage layer), complementare a tali iniziative. Più avanti illustreremo in particolare come il nostro lavoro possa integrarsi con MITRE ATLAS.

Questa classificazione non deve essere considerata un prodotto definitivo. Come molti aspetti legati all'intelligenza artificiale, si tratta di un lavoro in continua evoluzione in un settore che cambia rapidamente. Riteniamo tuttavia che rappresenti un contributo importante agli sforzi già in corso per classificare le minacce e ci impegniamo a mantenerla costantemente aggiornata e pertinente, mano a mano che emergeranno nuove minacce e nuove categorie di rischio.

Leggi tutto l’articolo: https://www.sophos.com/en-us/blog/a-double-edged-bleeding-edge-classifying-ai-threats