OpenAI lancia GPT-5.4 con uso nativo del computer, sfida i rivali dell'AI

OpenAI accelera la corsa all'AI di frontiera con il lancio di GPT-5.4

Appena due giorni dopo aver introdotto GPT-5.3 Instant, OpenAI ha presentato GPT-5.4, posizionandolo come il suo "modello di frontiera più capace ed efficiente per il lavoro professionale". Questa rapida successione di rilasci sottolinea l'intensa pressione competitiva nel mercato dell'AI generativa, dove rivali come Claude Opus 4.6 di Anthropic e Gemini 3.1 Pro di Google stanno lottando per la supremazia. Il lancio arriva anche durante un periodo di turbolenza per OpenAI, segnato da polemiche su un accordo con il Dipartimento della Difesa degli Stati Uniti e cancellazioni da parte degli utenti.

Il nuovo modello introduce diversi avanzamenti significativi, in particolare le capacità native di utilizzo del computer, una massiccia finestra di contesto di 1 milione di token tramite l'API e un sistema di chiamata degli strumenti rielaborato. Disponibile in due varianti specializzate—GPT-5.4 Thinking e GPT-5.4 Pro—il modello è progettato per affrontare compiti professionali complessi e multi-step.

Uso nativo del computer: un passo verso agenti autonomi

La caratteristica più significativa di GPT-5.4 è la sua capacità integrata di operare su un computer. OpenAI descrive questo come il suo primo modello di uso generale rilasciato con "capacità native di utilizzo del computer di ultima generazione" nel suo strumento di sviluppo Codex e API. Ciò consente agli agenti AI di eseguire flussi di lavoro su diverse applicazioni scrivendo codice (utilizzando librerie come Playwright) o emettendo comandi diretti del mouse e della tastiera in risposta agli screenshot.

Questa capacità va oltre i semplici wrapper dell'interfaccia utente, rappresentando un passo fondamentale verso il futuro agenziale che le aziende di AI prevedono. Consente compiti automatizzati a lungo termine come la raccolta di dati, l'analisi e la generazione di rapporti senza un costante intervento umano. OpenAI rivendica record di benchmark nelle valutazioni di utilizzo del computer come OSWorld-Verified e WebArena Verified.

Precisione e prestazioni professionali migliorate

OpenAI sta promuovendo GPT-5.4 come il suo "modello più fattuale finora". La società riferisce che, su un dataset di prompt de-identificati dove gli utenti avevano precedentemente segnalato errori, le singole affermazioni hanno il 33% di probabilità in meno di essere false e le risposte complete hanno il 18% di probabilità in meno di contenere errori rispetto a GPT-5.2.

Il feedback dei primi tester evidenzia sostanziali guadagni in domini professionali. Daniel Swiecki di Walleye Capital ha riportato un miglioramento di 30 punti percentuali nell'accuratezza nelle valutazioni interne di finanza ed Excel, collegandolo all'automazione estesa. Il modello ha ottenuto un punteggio record dell'83% nel benchmark GDPval di OpenAI, che testa le prestazioni su compiti del mondo reale in 44 occupazioni, superando i lavoratori d'ufficio nella maggior parte dei casi.

continua a leggere sotto...

Specifiche tecniche e varianti del modello

GPT-5.4 è disponibile in due varianti principali, ciascuna adattata per diversi casi d'uso e livelli di piani di servizio di OpenAI.

GPT-5.4 Thinking: Progettato come modello di ragionamento, sarà disponibile per tutti gli abbonati a ChatGPT a pagamento (piano Plus e superiori).
GPT-5.4 Pro: Ottimizzato per compiti complessi ad alte prestazioni, è riservato agli utenti ChatGPT Pro ($200/mese) e piano Enterprise.

Entrambe le varianti saranno disponibili nell'API e nell'applicazione Codex di OpenAI. La versione API supporta la finestra di contesto di 1M token innovativa, la più grande offerta da OpenAI, e presenta una maggiore efficienza dei token, risolvendo problemi con meno token rispetto al suo predecessore. Un nuovo sistema di Ricerca Strumenti consente al modello di cercare definizioni di strumenti secondo necessità, accelerando le richieste e riducendo i costi in sistemi con molti strumenti disponibili.

Mirare all'impresa: servizi finanziari e fogli di calcolo

Un focus principale di questo rilascio è lo spazio di lavoro professionale. OpenAI sta lanciando OpenAI per i Servizi Finanziari, una suite che include una versione di ChatGPT che funziona direttamente all'interno di Microsoft Excel e Google Fogli. Ciò è rafforzato da partnership con fornitori di dati come FactSet, MSCI, Third Bridge e Moody's.

La capacità del modello di "cercare più persistentemente attraverso più round per identificare le fonti più rilevanti" lo rende particolarmente adatto per analisi finanziarie complesse e compiti legali. Il CEO di Mercor, Brendan Foody, ha dichiarato che GPT-5.4 eccelle nella creazione di "prodotti a lungo termine come presentazioni, modelli finanziari e analisi legali", offrendo prestazioni di alto livello essendo più veloce e meno costoso rispetto ai modelli di frontiera rivali.

Contesto di mercato e panorama competitivo

GPT-5.4 entra in un'arena ferocemente competitiva. Sebbene rivendichi la leadership nell'uso del computer desktop e nel lavoro di conoscenza professionale, il panorama rimane frammentato. Claude Opus 4.6 di Anthropic guida ancora diversi benchmark di programmazione, e Gemini 3.1 Pro di Google detiene vantaggi nel ragionamento astratto e offre una grande finestra di contesto a un prezzo inferiore.

La decisione di OpenAI di confrontarsi con GPT-5.2, piuttosto che con il recentissimo GPT-5.3, è un modello degno di nota che fornisce contesto alle sue cifre di prestazione di testa. La pubblicazione da parte della società della sua metodologia di valutazione della catena di pensiero come open source è un passo verso una maggiore trasparenza e scrutinio esterno.

Perché questo lancio è importante

L'introduzione di GPT-5.4 è più di un semplice aggiornamento del modello. La sua capacità di utilizzo nativo del computer rappresenta un cambiamento di paradigma, spostando l'AI da uno strumento di conversazione a una forza lavoro attiva e automatizzata. Ciò ha profonde implicazioni per il software di produttività, l'automazione dei processi aziendali e il futuro del lavoro intellettuale.

Integrandosi profondamente con fornitori di dati finanziari e applicazioni di fogli di calcolo, OpenAI sta facendo una mossa diretta per il lucrativo mercato aziendale, mirando a diventare uno strumento indispensabile per i lavoratori della conoscenza. La velocità di questo rilascio, avvenuto appena pochi giorni dopo GPT-5.3, segnala l'impegno di OpenAI a mantenere il suo vantaggio tecnologico percepito in un mercato dove la scoperta di ieri è il requisito minimo di oggi.

OpenAI lancia GPT-5.4 con uso nativo del computer, sfida i rivali dell'AI

OpenAI accelera la corsa all'AI di frontiera con il lancio di GPT-5.4

Uso nativo del computer: un passo verso agenti autonomi

Precisione e prestazioni professionali migliorate

Specifiche tecniche e varianti del modello

Mirare all'impresa: servizi finanziari e fogli di calcolo

Contesto di mercato e panorama competitivo

Perché questo lancio è importante

Related News

Anthropic riscrive l'ingegneria del contesto per Claude 5: meno regole, più giudizio

L'AI open-weight segue la traiettoria di Kubernetes in mezzo alle tensioni geopolitiche

Istituti per la sicurezza dell'IA del Regno Unito e degli Stati Uniti scoprono che Kimi K3 si avvicina alla frontiera nelle capacità informatiche, ma è in ritardo nell'esecuzione degli exploit

I Giganti della Tecnologia Mettono in Guardia contro l'Eccessiva Regolamentazione dei Modelli AI a Peso Aperto

Fondatori di Startup Esortano gli USA a Mantenere Accessibile l'AI Open-Weight Cinese

Le barriere dell'IA ostacolano la legittima ricerca sulla sicurezza informatica, secondo gli esperti