OpenAI lancia GPT-5.6 Sol sotto le restrizioni del governo statunitense
OpenAI svela GPT-5.6 in mezzo a tensioni normative
OpenAI ha rilasciato la suite di modelli GPT-5.6, composta da Sol, Terra e Luna, in un'anteprima limitata che segue una richiesta diretta dell'amministrazione Trump. La mossa, annunciata il 26 giugno 2026, segna un passo significativo nella tensione in corso tra lo sviluppo dell'AI di frontiera e le preoccupazioni per la sicurezza nazionale. L'azienda sta distribuendo i modelli a un piccolo gruppo di partner fidati, con l'approvazione governativa richiesta per ogni partecipante.
Il CEO Sam Altman ha informato i dipendenti in un memo che il governo ha richiesto un rilascio scaglionato, approvando i clienti uno per uno durante il periodo di anteprima. Ciò riecheggia il recente lancio di Mythos di Anthropic, che ha affrontato restrizioni simili. OpenAI ha chiarito che questo accordo non è il suo modello preferito a lungo termine, definendolo un "passaggio a breve termine" verso una più ampia disponibilità nelle prossime settimane.
Tre livelli di intelligenza: Sol, Terra e Luna
La famiglia GPT-5.6 introduce un nuovo sistema di denominazione in cui il numero indica la generazione e i nomi dei livelli—Sol, Terra e Luna—indicano livelli di capacità durevoli. Sol è il modello di punta, progettato per i compiti più impegnativi. Terra offre un'opzione equilibrata per il lavoro quotidiano, mentre Luna è ottimizzato per velocità e convenienza economica.
OpenAI afferma che Sol è il suo modello più potente finora, con capacità agentive migliorate in programmazione, biologia e cybersecurity. Introduce una modalità max reasoning effort per analisi approfondite e una modalità ultra che coordina più sotto-agenti per affrontare compiti complessi. Questa architettura consente a Sol di superare i modelli precedenti in benchmark come Terminal-Bench 2.1 per flussi di lavoro di programmazione e GeneBench v1 per analisi biologiche.
Prestazioni nei benchmark e vantaggio competitivo
GPT-5.6 Sol stabilisce un nuovo stato dell'arte su Terminal-Bench 2.1, che testa flussi di lavoro da riga di comando che richiedono pianificazione e coordinamento di strumenti. Su ExploitBench, Sol è competitivo con Claude Mythos Preview di Anthropic utilizzando solo circa un terzo dei token di output. Questo guadagno di efficienza è un fattore chiave di differenziazione nel dominio della cybersecurity.
Il modello mostra anche buone prestazioni su ExploitGym, un benchmark creato dai ricercatori dell'UC Berkeley in collaborazione con OpenAI. Anche Terra e Luna mostrano miglioramenti nelle capacità cyber all'aumentare del ragionamento. OpenAI sottolinea che Sol è più bravo a trovare e correggere vulnerabilità che a eseguire attacchi end-to-end, posizionandolo come uno strumento difensivo piuttosto che offensivo.
Stack di sicurezza: difese a strati contro l'abuso
OpenAI ha implementato il suo stack di sicurezza più robusto fino ad oggi con GPT-5.6. Il sistema include addestramento a livello di modello per rifiutare assistenza cyber proibita, classificatori in tempo reale che valutano gli output durante la generazione e revisione a livello di account per comportamenti malevoli persistenti. Per i casi ad alto rischio, un modello di ragionamento più grande può mettere in pausa la generazione e valutare il contesto prima di rilasciare l'output.
L'azienda ha dedicato oltre 700.000 ore GPU equivalenti ad A100 al red-teaming automatizzato, concentrandosi sulla ricerca di jailbreak universali che funzionano su molti prompt. Questo sforzo è completato dal red-teaming umano esperto, che continua durante l'anteprima. OpenAI mantiene un processo di risposta rapida per affrontare vulnerabilità scoperte di recente e aggiornare le salvaguardie.
Nonostante queste misure, GPT-5.6 Sol non supera la soglia Cyber Critical secondo il Preparedness Framework di OpenAI. Nelle valutazioni che coinvolgono Chromium e Firefox, ha identificato bug ma non ha prodotto autonomamente un exploit funzionale a catena completa. Tuttavia, l'azienda riconosce che i benchmark non possono catturare ogni potenziale scenario di abuso.
Accesso governativo e implicazioni per il settore
L'anteprima è limitata a circa 20 aziende la cui partecipazione è stata condivisa con il governo statunitense. OpenAI ha presentato in anteprima GPT-5.6 all'amministrazione nell'ultimo mese, inclusi incontri tra Altman e funzionari della Casa Bianca all'inizio di giugno. L'azienda prevede di espandere l'accesso a più organizzazioni la prossima settimana, con un rilascio più ampio previsto nelle prossime settimane.
La posizione di OpenAI sulle restrizioni è chiara: "Non crediamo che questo tipo di processo di accesso governativo debba diventare l'impostazione predefinita a lungo termine. Tiene i migliori strumenti lontani da utenti, sviluppatori, aziende, difensori cyber e partner globali che ne hanno bisogno." L'azienda sta lavorando con l'amministrazione per sviluppare un quadro di Executive Order sulla cybersicurezza e un processo ripetibile per i futuri rilasci di modelli.
Entro agosto, come parte dell'Executive Order, l'amministrazione deve stabilire un processo classificato per valutare le capacità cyber dei modelli AI e determinare quali qualificano come "modelli di frontiera coperti". Questo contesto normativo sta plasmando le strategie di rilascio dei principali laboratori AI, tra cui OpenAI e Anthropic.
Prezzi e disponibilità
GPT-5.6 ha un prezzo per milione di token attraverso i tre livelli: Sol a $5 input / $30 output, Terra a $2,50 input / $15 output e Luna a $1 input / $6 output. I modelli introducono una memorizzazione nella cache dei prompt più prevedibile con punti di interruzione espliciti della cache e una durata minima della cache di 30 minuti. Le scritture nella cache vengono fatturate a 1,25x la tariffa di input non memorizzata nella cache, mentre le letture ricevono uno sconto del 90%.
OpenAI prevede anche di lanciare GPT-5.6 Sol su hardware Cerebras a luglio, offrendo velocità fino a 750 token al secondo. L'accesso sarà inizialmente limitato a clienti selezionati man mano che la capacità si espande. Durante l'anteprima, i modelli saranno disponibili tramite API e Codex, con una più ampia integrazione ChatGPT prevista a breve.
La strada da percorrere
Il periodo di anteprima è progettato per testare sia le capacità del modello che l'efficacia delle salvaguardie. OpenAI vuole capire se gli utenti legittimi possono completare il lavoro normale in modo affidabile mentre il sistema limita gli abusi. Il feedback informerà le modifiche per ridurre blocchi e ritardi non necessari prima del rilascio su larga scala.
Ai clienti aziendali vengono offerti approcci a lungo termine, tra cui rilevamento che preserva la privacy e controlli di sicurezza gestiti dal cliente. OpenAI sta anche lavorando su un accesso calibrato in base al profilo di rischio di ciascun cliente, utente o carico di lavoro. L'obiettivo dell'azienda è un rilascio ampio nelle prossime settimane, in attesa di test riusciti e approvazione governativa.
Questo rilascio rappresenta un caso di prova critico per la relazione tra lo sviluppo dell'AI di frontiera e la sicurezza nazionale. Man mano che i modelli diventano più capaci, l'equilibrio tra innovazione e regolamentazione continuerà a plasmare il settore. L'esperienza di OpenAI con GPT-5.6 potrebbe stabilire un precedente per come i modelli futuri verranno lanciati in un ambiente regolamentato.
Related News

Il governo degli Stati Uniti verificherà tutti gli utenti di GPT-5.6 in una regolamentazione storica dell'AI

Claude vs ChatGPT: percorsi di crescita divergenti tra le indagini dell'AI del Pentagono

Amazon investe 200 miliardi di dollari in AI entro il 2026, inclusa l'espansione di AWS Trainium e India

OpenAI Ritira GPT-4.5, Lancia GPT-5.6 Vettato Sotto la Supervisione degli Stati Uniti

Il governo degli Stati Uniti approva il lancio di GPT-5.6 di OpenAI in una importante svolta nella politica sull'AI

