ChatGPT 5.5 Pro Risolve la Matematica di Livello PhD, Innalza la Barra della Ricerca AI

L'AI Attraversa una Nuova Frontiera nella Ricerca Matematica

I grandi modelli linguistici stanno gradualmente invadendo territori un tempo considerati unicamente umani. Ma un recente esperimento dettagliato dal matematico Timothy Gowers rivela un potenziale cambio di paradigma. ChatGPT 5.5 Pro, un modello avanzato di OpenAI, non solo ha assistito nella ricerca—ma ha prodotto autonomamente una dimostrazione matematica originale e di livello pubblicabile in meno di due ore, senza alcun serio input matematico da parte del suo collaboratore umano.

L'impresa non è stata un caso. Gowers, un vincitore della Medaglia Fields, ha presentato all'AI un problema specifico della teoria additiva dei numeri riguardante le possibili dimensioni degli insiemi somma h-fold. Il modello non solo ha migliorato una dimostrazione umana esistente, ma lo ha fatto introducendo un'idea “originale e ingegnosa” che ha impressionato l'autore dell'articolo originale, lo studente del MIT Isaac Rajagopal.

L'Esperimento: Da un Problema Facile a una Vera Intuizione

Gowers contestualizza lo stato attuale dell'AI in matematica. Inizialmente, le “soluzioni” dei modelli linguistici grandi a problemi famosi come i problemi di Erdős erano spesso banali o facilmente deducibili dalla letteratura nota. Le risate si sono spente. Ora, se un problema ha un argomento facile trascurato, un modello linguistico grande ha una buona probabilità di individuarlo.

Cercando una prova più difficile, Gowers ha scelto un articolo di Mel Nathanson che esplora il parametro N(h,k), definito come il numero intero minimo N tale che tutte le possibili dimensioni di un insieme somma h-fold per un insieme di k elementi possano essere realizzate all'interno dell'intervallo {0,1,...,N}. Per h=2, Nathanson aveva un limite esponenziale. Gowers ha chiesto a ChatGPT 5.5 Pro di migliorarlo.

In 17 minuti, l'AI ha fornito una costruzione che ha prodotto un limite superiore quadratico—chiaramente ottimale. Poi ha formattato la dimostrazione in LaTeX. Per un problema correlato sugli insiemi somma ristretti, ha avuto successo “senza alcun problema”. La vera sfida era generalizzare il risultato per qualsiasi h.

La Scoperta: Una Costruzione Polinomiale “Ingegnosa”

Il nucleo del lavoro precedente di Rajagopal si basava sulla combinazione di insiemi di serie geometriche S e T, i cui elementi crescono in modo esponenzialmente grande con k. Ciò ha portato a un limite esponenziale per N(h,k). Il compito di ChatGPT era di stringerlo.

Il suo primo tentativo, dopo 16 minuti, ha migliorato il limite da esponenziale in k a esponenziale in k^α per qualsiasi α > 1/2. Ma il vero passo avanti è arrivato quando è stato sollecitato a spingere per un limite polinomiale.

“ChatGPT è tornato con una risposta, costruendo insiemi G e H che si comportano come ‘metà di una serie geometrica compressa in un intervallo polinomiale,’ il che è controintuitivo,” scrive Rajagopal nella sua valutazione. L'AI ha utilizzato insiemi h²-dissociati—un concetto algebrico risalente a Bose e Chowla (1963)—per creare componenti con elementi di dimensione polinomiale che imitavano le proprietà cruciali della dimensione degli insiemi somma delle serie geometriche esponenziali.

Rajagopal afferma che questa idea “è abbastanza impressionante” e “il tipo di idea di cui sarei molto orgoglioso dopo una settimana o due di riflessione.” La costruzione finale combina questi componenti di dimensione polinomiale per dimostrare N(h,k) ≤ O(k^10h³), una riduzione monumentale da una dipendenza esponenziale a una polinomiale.

continua a leggere sotto...

Convergenza con un'Evoluzione più Ampia dell'AI

Questa impresa matematica coincide con l'introduzione più ampia di GPT-5.5 Instant come nuovo modello predefinito di ChatGPT. OpenAI afferma che produce il 52,5% in meno di allucinazioni su richieste ad alto rischio in medicina, legge e finanza e ottiene 81,2 nel test di matematica AIME 2025, rispetto a 65,4.

L'aggiornamento enfatizza anche una maggiore personalizzazione e memoria. GPT-5.5 Instant può ora sfruttare le chat precedenti, i file caricati e gli account Gmail collegati per personalizzare le risposte, riducendo la necessità di richieste ripetitive. I nuovi controlli sulla “fonte di memoria” mostrano agli utenti quale contesto è stato utilizzato, consentendo la correzione o la cancellazione.

Questi progressi evidenziano una doppia traiettoria: la potenza del ragionamento grezzo sta aumentando, come si vede nella dimostrazione matematica, mentre l'interfaccia sta diventando più integrata nei flussi di lavoro personali e professionali.

Il Costo Umano e il Nuovo Paradigma di Ricerca

L'esperimento di Gowers costringe a fare i conti con il futuro della formazione e della scoperta matematica. Egli nota che il percorso tradizionale per uno studente di dottorato all'inizio—risolvere un problema aperto “facile”—potrebbe svanire. “Il limite inferiore per contribuire alla matematica sarà ora dimostrare qualcosa che i modelli linguistici grandi non possono dimostrare.”

Ciò crea un dilemma di accesso. Come sottolinea il commentatore Olof Sisask, i modelli di punta sono costosi, creando disuguaglianza. “L'età dell'uguaglianza... è purtroppo finita nella ricerca matematica,” aggiunge un altro.

Gowers propone un futuro collaborativo: il compito diventa “dimostrare qualcosa in collaborazione con i modelli linguistici grandi che essi non possono gestire da soli.” Ha scoperto che i modelli linguistici grandi fanno contributi utili, se non ancora rivoluzionari, nel suo lavoro.

Dove Appartengono le Dimostrazioni Generate dall'AI?

La dimostrazione riuscita creata da ChatGPT 5.5 Pro esiste in un limbo di pubblicazione. “Se il risultato fosse stato prodotto da un matematico umano, sarebbe stato sicuramente pubblicabile,” scrive Gowers. Ma arXiv vieta i contenuti scritti dall'AI.

Gowers suggerisce la necessità di un nuovo repository moderato per i risultati prodotti dall'AI, certificati da matematici umani o assistenti di dimostrazione formale. Fino ad allora, la dimostrazione vive su un link di Google Drive—una casa transitoria adatta per una nuova forma di creazione di conoscenza disgregante.

Le implicazioni si estendono oltre la matematica. Come ha notato un commentatore, “Vedremo domande simili sollevate per la maggior parte delle attività intellettualmente gratificanti.” Per ora, l'incursione di ChatGPT 5.5 Pro nella combinatoria additiva rappresenta un chiaro indicatore di quanto e come velocemente le capacità cognitive dell'AI siano avanzate.

ChatGPT 5.5 Pro Risolve la Matematica di Livello PhD, Innalza la Barra della Ricerca AI

L'AI Attraversa una Nuova Frontiera nella Ricerca Matematica

L'Esperimento: Da un Problema Facile a una Vera Intuizione

La Scoperta: Una Costruzione Polinomiale “Ingegnosa”

Convergenza con un'Evoluzione più Ampia dell'AI

Il Costo Umano e il Nuovo Paradigma di Ricerca

Dove Appartengono le Dimostrazioni Generate dall'AI?

Related News

Il governo degli Stati Uniti verificherà tutti gli utenti di GPT-5.6 in una regolamentazione storica dell'AI

Claude vs ChatGPT: percorsi di crescita divergenti tra le indagini dell'AI del Pentagono

Amazon investe 200 miliardi di dollari in AI entro il 2026, inclusa l'espansione di AWS Trainium e India

OpenAI Ritira GPT-4.5, Lancia GPT-5.6 Vettato Sotto la Supervisione degli Stati Uniti

Il governo degli Stati Uniti approva il lancio di GPT-5.6 di OpenAI in una importante svolta nella politica sull'AI

OpenKnowledge Lancia: Alternativa Open-Source AI-First a Obsidian e Notion