Lo scorso 26 giugno 2026 OpenAI ha svelato GPT-5.6, una nuova famiglia di modelli che introduce un cambio di paradigma significativo nel modo in cui l’intelligenza artificiale si posiziona nel panorama della sicurezza informatica.
La versione di punta, denominata Sol, viene presentata come il modello AI più capace mai sviluppato per il dominio cyber e sarà affiancata da Terra, pensata per i carichi di lavoro quotidiani, e Luna, ottimizzata per velocità e costo contenuto.
Ma la notizia non è solo tecnologica. GPT-5.6 Sol arriva con un sistema di sicurezza stratificato che OpenAI definisce il più robusto mai implementato e con un modello di distribuzione che prevede una supervisione esplicita da parte del governo degli Stati Uniti.
Un segnale chiaro: quando le capacità offensive di un modello AI raggiungono certi livelli, il rilascio libero al mercato non è più un’opzione scontata.
Per chi opera nel campo della cyber security, consulenti, CISO, team di difesa, capire cosa GPT-5.6 Sol può effettivamente fare e cosa non può ancora fare da solo, è oggi più rilevante che mai.
Cos’è GPT-5.6 Sol e come si inserisce nella nuova architettura della famiglia
Con GPT-5.6, OpenAI abbandona la nomenclatura tradizionale per adottare un sistema a due assi: il numero identifica la generazione del modello, mentre i nomi Sol, Terra e Luna designano tier di capacità permanenti, destinati ad evolversi indipendentemente.
Una scelta comunicativa non banale: segnala che l’azienda intende costruire linee di prodotto differenziate per capacità e rischio, non semplici aggiornamenti incrementali.
GPT-5.6 Sol è il flagship. Introduce due nuove modalità operative:
- max reasoning effort, che consente al modello di dedicare più tempo a ragionamenti profondi su problemi complessi;
- ultra mode, che va oltre le capacità del singolo agente sfruttando subagenti per parallelizzare il lavoro.
Sul benchmark Terminal-Bench 2.1, che misura workflow a riga di comando richiedenti pianificazione, iterazione e coordinamento di tool, Sol stabilisce un nuovo stato dell’arte.
GPT-5.6 Terra, il modello bilanciato, offre prestazioni competitive con GPT-5.5 a metà del costo operativo. GPT-5.6 Luna è la scelta per chi prioritizza velocità e budget. Tutti e tre mostrano miglioramenti significativi nelle capacità cyber su ExploitGym, il benchmark sviluppato da ricercatori UC Berkeley in collaborazione con OpenAI e altri laboratori frontier.
Indice degli argomenti
Le capacità cyber di GPT-5.6 Sol: vulnerability research, exploit e i limiti dichiarati
L’interesse sulle novità di GPT-5.6 Sol riguarda soprattutto quelle che sono le sue nuove capacità cyber.
Benchmark e performance: cosa dicono i numeri
Il dato più citato nel rilascio ufficiale riguarda ExploitBench, il benchmark specializzato per task di sicurezza a lungo orizzonte: GPT-5.6 Sol raggiunge prestazioni competitive con Anthropic Mythos Preview, il modello considerato fino ad oggi il riferimento assoluto nel settore, utilizzando però solo circa un terzo dei token di output.
Un risultato che, tradotto in termini pratici, significa efficienza operativa e costi API nettamente inferiori a parità di capacità.
Su ExploitGym, l’intera famiglia GPT-5.6 mostra miglioramenti sostanziali all’aumentare della capacità di reasoning, confermando una tendenza ormai chiara nel settore: più il modello è capace di ragionare in modo prolungato e strutturato, più le sue performance su task offensivi e difensivi crescono in modo non lineare.
OpenAI ha anche testato Sol contro il proprio framework interno VulnLMP, progettato per valutare lo sviluppo end-to-end di exploit chain su target reali.
Il risultato è significativo: il modello produce lead credibili su vulnerabilità di memory safety, alcune delle quali potrebbero portare a disclosure, corruzione del flusso di controllo o mutation dei dati.
Questo suggerisce, nelle parole degli stessi ricercatori, che “parti sostanziali della vulnerability research reale stanno diventando sempre più automatizzabili quando i modelli sono abbinati a tool use, build system e infrastrutture di verifica”.
I limiti: cosa Sol non è ancora in grado di fare autonomamente
Un punto fondamentale e spesso sottovalutato nel dibattito pubblico è che GPT-5.6 Sol non raggiunge la soglia Cyber Critical definita dal Preparedness Framework di OpenAI.
In test condotti su Chromium e Firefox, il modello ha identificato bug e primitivi di exploitation, ma non ha prodotto autonomamente un exploit funzionale a catena completa nelle condizioni testate.
È una distinzione cruciale per chi valuta il rischio reale: Sol è oggi uno strumento straordinariamente efficace per accelerare la vulnerability research, ma non è ancora un sistema capace di condurre attacchi end-to-end autonomi contro target hardened. Il salto qualitativo è reale, ma la distanza dalla piena autonomia offensiva rimane.
Questa distinzione tra “capace di trovare vulnerability” e “capace di attaccare autonomamente” è esattamente il punto su cui le organizzazioni devono calibrare le proprie valutazioni di rischio.
Un modello che accelera la ricerca di vulnerabilità è un vantaggio enorme per i blue team, ma significa anche che il tempo tra disclosure e weaponization da parte di attori malintenzionati si riduce drasticamente.
La finestra di patching si accorcia.
Il safety stack a più livelli: come OpenAI ha ridisegnato la difesa del modello
La caratteristica forse più rilevante di GPT-5.6, almeno dal punto di vista di chi si occupa di sicurezza applicata all’AI, è l’architettura di salvaguardia che lo accompagna. OpenAI la definisce il “safety stack più robusto mai sviluppato” e la struttura multilivello merita un’analisi dettagliata.
Primo livello: il modello stesso
Il primo strato di difesa è incorporato nel modello tramite training. GPT-5.6 è addestrato a rifiutare assistenza cyber proibita, inclusi i casi in cui l’utente tenti di camuffare le proprie intenzioni o di eseguire jailbreak.
Non si tratta di un filtro esterno, ma di un comportamento intrinseco al modello, che costituisce il confine di base tra ciò che è consentito e ciò che non lo è.
Secondo livello: classificatori in tempo reale
Durante la generazione dell’output, classificatori specializzati per misuse cyber e biologico valutano il contenuto in tempo reale. Se rilevano una potenziale violazione nei casi ad alto rischio, la generazione può essere messa in pausa mentre un modello di reasoning secondario, più grande, analizza l’intera conversazione e il suo contesto.
Se l’output viene classificato come non consentito, viene trattenuto prima di raggiungere l’utente.
Questo approccio basato su un modello che giudica un altro modello in tempo reale rappresenta una novità architetturale importante. Non si tratta, infatti, di un semplice pattern matching, ma di un sistema di valutazione contestuale che distingue, ad esempio, tra ricerca di sicurezza legittima e tentativo di produrre codice offensivo.
Terzo livello: revisione account-level
L’attività segnalata può attivare una revisione a livello di account che attraversa le conversazioni rilevanti e i segnali di rischio associati.
Analizzare il comportamento nel tempo, e non solo la singola interazione, permette ai sistemi di distinguere tra comportamento malevolo persistente e lavoro di sicurezza dual-use legittimo, dove concetti tecnici simili possono apparire in contesti molto diversi.
Quarto livello: accesso differenziato
Non tutte le capacità sono disponibili di default a tutti gli utenti. OpenAI mantiene configurazioni di accesso differenziate in base al profilo di rischio dell’utente, del cliente o del workload.
Per il contesto Enterprise, l’azienda sta lavorando su approcci a lungo termine che includono rilevamento privacy-preserving, controlli di sicurezza gestiti dal cliente e accesso calibrato al rischio.
700.000 ore GPU dedicate al red teaming automatizzato: un investimento inedito
Un dato che raramente emerge nelle analisi superficiali del rilascio è questo: OpenAI ha dedicato oltre 700.000 ore GPU al red teaming automatizzato, con l’obiettivo specifico di trovare jailbreak universali, ossia attacchi in grado di funzionare su molti prompt o contesti, non solo su una singola configurazione nota.
La scelta di focalizzarsi sui jailbreak universali, piuttosto che su singoli failure point, è strategicamente rilevante: significa testare le salvaguardie oltre i casi noti, esplorando pattern di attacco che i test umani da soli non potrebbero coprire, e riducendo il tempo tra la scoperta di una debolezza e la sua correzione.
Il red teaming automatizzato è completato da un esteso programma di red teaming umano condotto da tester terzi esperti, che continuerà durante il periodo di preview. La logica è chiara: i sistemi automatizzati trovano i pattern ad alta frequenza e bassa creatività, gli esperti umani trovano gli attacchi creativi che i sistemi automatizzati non anticipano.
OpenAI mantiene inoltre un processo di risposta rapida per identificare, valutare, prioritizzare e correggere i jailbreak di nuova scoperta, aggiungendoli continuamente alle valutazioni in corso. Un sistema di sicurezza vivo, non statico.
Rilascio controllato e supervisione governativa: il modello distributivo che cambia le regole
Forse l’aspetto più inedito del lancio di GPT-5.6 Sol non è tecnologico, ma politico-regolatorio. Per la prima volta, un’azienda AI di frontiera ha coordinato il rilascio di un proprio modello con il governo degli Stati Uniti prima del lancio al pubblico e ha accettato di partire con una preview limitata a un piccolo gruppo di partner fidati la cui partecipazione è stata condivisa con le autorità federali.
Questa scelta è il risultato diretto di un Executive Order firmato dal Presidente Trump nel giugno 2026, che ha creato un framework per consentire al governo federale di valutare le capacità dei modelli AI avanzati e determinare quali qualificano come “covered frontier models (una designazione per sistemi con capacità cyber avanzate che potenzialmente implicano rischi per la sicurezza nazionale).
OpenAI ha chiarito la propria posizione in modo esplicito: non ritiene che questo tipo di processo di clearance governativa debba diventare il default a lungo termine, perché mantenere i migliori strumenti lontani da utenti, sviluppatori, aziende, cyber defender e partner globali che ne hanno bisogno ha un costo reale.
La misura viene presentata come un passo a breve termine per garantire la disponibilità più ampia possibile nel giro di settimane, mentre si lavora con l’Amministrazione per sviluppare un framework per le versioni future.
Implicazioni operative per CISO e team di sicurezza: cosa fare adesso
Il rilascio della preview di ChatgPT-5.6 Sol comporta anche alcune precise implicazioni operative in tema di sicurezza informatica che, quindi, riguardano direttamente sia i CISO sia i team di sicurezza.
Per i blue team e i security analyst
GPT-5.6 Sol rappresenta un’opportunità concreta per accelerare il vulnerability research interno, la code review e lo sviluppo di patch.
La capacità di identificare bug in codebase complesse come Chromium, anche se non di produrre exploit completi in modo autonomo, può ridurre significativamente il tempo di analisi su progetti open source critici utilizzati nelle infrastrutture aziendali.
Il consiglio operativo è di iniziare con use case ben perimetrati: analisi di dipendenze open source, review di configurazioni di sicurezza, supporto alla documentazione delle vulnerability.
Evitare anche di usare Sol su sistemi produttivi senza aver definito policy chiare su cosa il modello può e non può fare nel contesto aziendale.
Per i red team e i penetration tester
L’efficienza di Sol su ExploitBench, con risultati comparabili a Mythos Preview ma con un terzo dei token usati, è un dato che i team offensivi interni troveranno immediatamente rilevante.
La capacità di reasoning prolungato con ultra mode apre scenari interessanti per la pianificazione di campagne di test complesse.
Tuttavia, la natura dual-use del modello significa che i classificatori in tempo reale potrebbero intervenire su richieste legittime di red teaming: è necessario pianificare questa variabile nella struttura operativa.
Per i CISO e i responsabili del rischio
Il rilascio di GPT-5.6 Sol impone un aggiornamento delle threat model aziendali. Se i modelli AI di frontiera stanno diventando strumenti efficaci per trovare vulnerabilità in codebase reali, anche senza produrre exploit completi autonomamente, il tempo medio tra la scoperta di una vulnerabilità e la sua exploitability da parte di attori malevoli si accorcia.
Questo si traduce in una pressione maggiore sui processi di patch management e vulnerability disclosure.
Sul fronte della governance AI interna, il rilascio di Sol è anche un’occasione per rivedere le policy sull’utilizzo dei modelli AI generativi da parte dei team di sviluppo e sicurezza: chi può usare questi strumenti, per quali attività, con quali controlli e audit trail.
Sol non è una minaccia, è uno specchio
GPT-5.6 Sol non è il modello che attaccherà autonomamente le infrastrutture. Ma è il modello che cambierà la velocità con cui le vulnerabilità vengono trovate, sia da chi le cerca per difendersi, sia da chi le cerca per sfruttarle.
La differenza tra i due scenari si chiama adozione precoce e competenza tecnica.
OpenAI ha fatto un passo significativo nel riconoscere che modelli con queste capacità richiedono una distribuzione controllata e responsabile. Il safety stack a quattro livelli, il red teaming automatizzato su scala industriale, la supervisione governativa del rilascio: sono tutti segnali che il settore sta maturando nella propria consapevolezza del rischio.
Ma la maturità del settore non sostituisce la maturità delle singole organizzazioni.
La domanda per chi lavora nella cyber security non è se usare GPT-5.6 Sol, ma come integrarlo in modo sicuro, con controlli adeguati e una comprensione chiara di cosa può e non può fare.
Chi risponderà a questa domanda prima degli altri avrà un vantaggio operativo reale. Chi la ignorerà si troverà ad affrontare avversari che invece l’hanno capita bene.












Partecipa alla community