La memoria ora domina i costi dei chip AI, alimentando la scarsità di offerta e il boom del mercato

Il costo in aumento vertiginoso della memoria dell'AI

La matematica fondamentale dell'intelligenza artificiale sta subendo un cambiamento sismico. Secondo nuovi dati di Epoch AI, il costo della memoria è aumentato fino a diventare la spesa dominante nella costruzione dei chip che alimentano la rivoluzione AI. La memoria ad alta larghezza di banda (HBM) ora rappresenta un sorprendente 63% della spesa totale per i componenti dei chip AI, un aumento significativo rispetto al 52% di appena due anni fa, nel Q1 2024.

Questa analisi, ponderata in base al volume di produzione dei progetti di Nvidia, AMD, Google e Amazon, rivela una drastica riallocazione del capitale. Mentre la quota dei die di logica è rimasta stabile vicino al 13%, la spesa per l'imballaggio avanzato (come CoWoS) è scesa dal 19% al 15%, e i componenti ausiliari sono scesi dal 15% al 9%. In termini di dollari assoluti, l'aumento è ancora più drammatico: la spesa totale per HBM tra questi quattro progettisti è esplosa da circa 12 miliardi di dollari nel 2024 a 32 miliardi di dollari nel 2025.

Perché la memoria è diventata l'elemento determinante

La ragione dell'ascesa della memoria è fondamentale per il funzionamento dell'AI moderna. L'addestramento e l'esecuzione di grandi modelli linguistici (LLM) richiedono ai processori di avere accesso rapido e simultaneo a enormi volumi di dati. L'HBM, impilata verticalmente accanto al die del processore, fornisce l'immensa larghezza di banda necessaria per alimentare queste bestie computazionali. Man mano che i modelli crescono di dimensioni - ora superando routinariamente centinaia di miliardi di parametri - la fame di memoria veloce e densa si intensifica solo.

Questa domanda insaziabile ha colliso con un'offerta vincolata, creando una classica stretta economica. I principali produttori di HBM come Samsung, SK Hynix e Micron Technology hanno visto i prezzi delle loro azioni salire rispettivamente del 114%, 186% e 141% dal'inizio del 2026. Come nota The Motley Fool, Micron è stata trasformata nel sentimento degli investitori da un giocatore ciclico di commodity a un abilitatore chiave del boom dell'AI, con la sua azione che recentemente è balzata da 448 a oltre 800 dollari.

L'effetto a catena: mettere a dura prova i budget dei data center

L'aumento del costo della memoria non è contenuto ai produttori di chip; sta cascando attraverso l'intero ecosistema dell'infrastruttura AI. I fornitori di cloud iperscala stanno sentendo direttamente la stretta nelle loro previsioni di spesa in conto capitale. La previsione di spesa in conto capitale di Microsoft per l'esercizio 2026 di 190 miliardi di dollari include una stima di 25 miliardi di dollari specificamente attribuita ai prezzi più alti dei componenti. Allo stesso modo, Meta ha aumentato la sua fascia di spesa in conto capitale per il 2026 di 10 miliardi di dollari, citando le stesse pressioni inflazionistiche.

I dati di Epoch AI suggeriscono che la situazione peggiorerà prima di migliorare. Con l'offerta di memoria che dovrebbe rimanere tesa e i prezzi che continuano a salire, la quota di HBM nella torta dei costi dei chip AI è prevista in ulteriore crescita nel 2026. Ciò crea un significativo collo di bottiglia per il ritmo di costruzione dei data center AI globali, come notato in un'analisi di Forbes. La carenza di componenti e l'aumento dei prezzi sono ora fattori importanti accanto ad altre difficoltà come la disponibilità di energia e la resistenza delle comunità locali.

continua a leggere sotto...

La minaccia incombente del ciclo di recessione

Nonostante l'attuale euforia, gli osservatori di mercato esperti sentono echi della storia. L'industria della memoria è notoriamente ciclica, incline a violenti cicli di boom e bust guidati da investimenti eccessivi durante periodi di alta domanda. Un rapporto di CNBC cita un avvertimento netto di un gestore di investimenti: "Sospetto che sia ancora il caso ogni volta che le persone fanno un argomento secondo cui il ciclo della memoria è finito, e ora è un'industria a lungo termine che crea valore - proprio prima che tutto vada terribilmente male".

Diversi fattori potrebbero innescare una flessione. In primo luogo, i fornitori di memoria, in risposta alla domanda attuale, hanno avviato progetti di espansione della produzione che dovrebbero entrare in linea entro il 2027. In secondo luogo, le sfide infrastrutturali e politiche potrebbero rallentare la costruzione dei data center pianificata che sostiene la domanda. Come evidenzia il pezzo di Forbes, la rete elettrica degli Stati Uniti dovrebbe quasi raddoppiare il suo carico di picco attuale per supportare tutti i data center pianificati entro il 2030 - un'impresa ardua.

L'innovazione come variabile imprevedibile: il fattore TurboQuant

Forse la variabile più imprevedibile è l'innovazione tecnologica volta a ridurre la dipendenza dalla memoria fisica. Nel marzo 2026, Google ha presentato TurboQuant, un nuovo metodo di compressione che afferma potrebbe ridurre la memoria necessaria per eseguire LLM di un fattore di sei. Progettato per rendere i modelli AI radicalmente più efficienti, uno sviluppo del genere ha il potenziale per tagliare drasticamente la domanda a lungo termine di chip HBM.

L'annuncio da solo ha causato un brusco calo dei prezzi delle azioni della memoria. Gli analisti di Deutsche Bank hanno avvertito gli investitori di "continuare a prepararsi per continue disruption legate all'AI", anche se hanno aggiunto che "resta da vedere" se TurboQuant creerà uno spostamento strutturale della domanda. Questa tensione tra scarsità di hardware ed efficienza del software sarà una battaglia determinante per l'economia dell'industria AI.

Oltre i data center: la rivoluzione AI locale

La rivoluzione della memoria sta anche rimodellando il panorama dell'informatica client. I processori Ryzen AI MAX 400 'Gorgon Halo' di AMD in arrivo, come riportato da Wccftech, supportano fino a 192 GB di memoria unificata. Ciò consente a un singolo chip di eseguire enormi LLM da 300 miliardi di parametri localmente, un'impresa precedentemente riservata ai rack dei server. Questa tendenza verso dispositivi client più potenti e ricchi di memoria potrebbe decentralizzare alcuni carichi di lavoro AI, aggiungendo un altro livello di complessità alle previsioni future della domanda di memoria.

Conclusione: un picco precario

I dati dipingono un quadro chiaro: la memoria è diventata il componente critico, costoso e vincolante dello stack AI. La sua dominanza sta guidando profitti record per i fornitori, mettendo a dura prova i budget delle più grandi aziende tecnologiche mondiali e forzando una riconsiderazione delle roadmap dell'infrastruttura AI. Tuttavia, l'industria si trova su un picco precario, bilanciato tra la domanda sostenuta da un mondo affamato di AI e le forze storiche dell'offerta ciclica eccessiva, dei limiti infrastrutturali e delle scoperte di software disruptive.

I prossimi anni testeranno se questo boom della memoria ha veramente rotto il vecchio ciclo o è semplicemente il suo capitolo più spettacolare finora. Per gli investitori, i fornitori di cloud e gli sviluppatori di AI, navigare in questo panorama richiederà un occhio attento sia alle catene di approvvigionamento del silicio che alla prossima ondata di algoritmi di efficienza.

La memoria ora domina i costi dei chip AI, alimentando la scarsità di offerta e il boom del mercato

Il costo in aumento vertiginoso della memoria dell'AI

Perché la memoria è diventata l'elemento determinante

L'effetto a catena: mettere a dura prova i budget dei data center

La minaccia incombente del ciclo di recessione

L'innovazione come variabile imprevedibile: il fattore TurboQuant

Oltre i data center: la rivoluzione AI locale

Conclusione: un picco precario

Related News

Anthropic riscrive l'ingegneria del contesto per Claude 5: meno regole, più giudizio

L'AI open-weight segue la traiettoria di Kubernetes in mezzo alle tensioni geopolitiche

Istituti per la sicurezza dell'IA del Regno Unito e degli Stati Uniti scoprono che Kimi K3 si avvicina alla frontiera nelle capacità informatiche, ma è in ritardo nell'esecuzione degli exploit

I Giganti della Tecnologia Mettono in Guardia contro l'Eccessiva Regolamentazione dei Modelli AI a Peso Aperto

Fondatori di Startup Esortano gli USA a Mantenere Accessibile l'AI Open-Weight Cinese

Le barriere dell'IA ostacolano la legittima ricerca sulla sicurezza informatica, secondo gli esperti