1h fa
Report JPMorgan: utilizzo LLM +70%, affitti GPU in rialzo da sette mesi, domanda AI ancora sostenuta
A cura di: Rita Tide Guide
Nel suo report "data center insights" pubblicato il 1° luglio, JPMorgan ha monitorato tre termometri della domanda di infrastrutture AI: utilizzo e prezzi dei token dei LLM, tariffe di noleggio delle GPU e prezzi spot dei chip di memoria. Il messaggio è netto: il contesto della domanda per l'AI resta favorevole.
Sulla piattaforma OpenRouter, l'uso di token è balzato del 70% su base mensile a giugno ed è risultato 20 volte superiore su base annua. Le tariffe di noleggio delle GPU sono aumentate per sette mesi consecutivi, con i prezzi delle B200 che oggi risultano circa il doppio delle H100. Sul fronte memoria, i prezzi spot della DRAM sono saliti di oltre otto volte rispetto a un anno fa. Per JPMorgan, la lettura incrociata di questi tre set di dati indica che la domanda di calcolo per l'AI è lontana dal picco.
Token: uso in forte crescita, prezzi quasi stabili
I dati OpenRouter hanno accelerato in modo diffuso a giugno. L'utilizzo dei token è cresciuto del 70% mese su mese e di 20 volte anno su anno. Il prezzo per invocazione è salito leggermente sul mese, ma su base annua è sceso solo del 5%; i modelli basati negli Stati Uniti hanno addirittura mostrato un aumento anno su anno. La spesa totale è aumentata del 70% mese su mese e di 16 volte anno su anno.
Letti insieme, i numeri indicano che la crescita dei volumi supera di gran lunga la flessione dei prezzi. Anche in uno scenario in cui il prezzo dei token scendesse del 5%–10% l'anno, un raddoppio continuo dell'utilizzo sarebbe sufficiente a spingere in modo significativo i ricavi da inference dei fornitori di modelli. La valutazione di J.P. Morgan è che l'economia dei token favorisca i model provider.
Sul mix, emerge una forte concentrazione: i modelli statunitensi rappresentano solo il 35% dell'utilizzo, ma intercettano oltre l'85% della spesa complessiva. Anthropic Claude Opus 4.7 è l'unico modello presente sia nella top 5 per utilizzo sia nella top 5 per spesa, un segnale che il potere di prezzo resta in mano ai player USA.
GPU: aumenti diffusi, B200 sempre più cara (ma il premio si riduce)
A giugno, le tariffe di noleggio GPU presso provider cloud non hyperscale sono aumentate mese su mese su tutta la linea. Le A100 sono salite del 6,3%, segnando il quinto mese consecutivo di rialzi; le H100 hanno guadagnato il 3,7%, proseguendo una tendenza al rialzo da sette mesi; le B200 sono aumentate del 2,7%, continuando una crescita regolare dall'avvio, avvenuto nove mesi fa.
Si restringe anche il differenziale tra fasce. Il premio della H100 rispetto alla A100 è sceso da 1,77x ad aprile a 1,67x a giugno. Il premio della B200 rispetto alla H100 è calato da 2,58x a 1,96x. La pressione sulla scarsità di potenza di calcolo di fascia alta appare in attenuazione, ma i prezzi continuano a salire: per JPMorgan, la domanda sta crescendo in linea con l'aumento dell'offerta.
Da notare il caso A100: l'incremento più marcato su un chip di generazione precedente suggerisce che clienti con vincoli di budget stanno competendo per capacità di calcolo più conveniente. Non è un segnale di eccesso di offerta.
Memoria: DRAM accelera, NAND si indebolisce
A giugno i prezzi spot della DRAM sono aumentati del 10% mese su mese a 43,14 dollari, +740% anno su anno, per il terzo mese consecutivo di rialzo. I prezzi spot della NAND sono scesi dello 0,3% mese su mese a 27,03 dollari, terzo mese di cali contenuti, pur restando a +518% anno su anno. I livelli restano storicamente elevati, ma la divergenza di trend è evidente: DRAM in rialzo, NAND in ammorbidimento.
La storia dei cicli della memoria indica che, quando il ciclo si avvicina al picco, la NAND tende a indebolirsi per prima e la DRAM segue in un secondo momento. Tre mesi consecutivi di flessione della NAND suggeriscono una fase più avanzata del ciclo. J.P. Morgan non formula esplicitamente questa conclusione, ma la dinamica dei dati punta in quella direzione.
Lettura d'insieme: domanda AI forte, struttura in evoluzione
Utilizzo LLM +70%, affitti GPU in rialzo da sette mesi, DRAM +740% anno su anno: tre segnali coerenti che indicano una domanda di infrastrutture AI ancora lontana dal picco. Al tempo stesso, la struttura si sta modificando: oltre l'85% della spesa si concentra su modelli USA; il premio della B200 sulla H100 scende da 2,58x a 1,96x, segnalando minore scarsità nella fascia alta; la NAND si allenta e il ciclo storage cambia marcia. I fattori di supporto restano presenti, ma la logica di mercato diventa più dinamica.
Tide View
Il principale punto cieco del report è il potenziale bias delle fonti dati. OpenRouter serve soprattutto sviluppatori, startup e casi d'uso legati ad agenti AI, e non include il traffico API diretto di OpenAI e Anthropic né l'utilizzo derivante da implementazioni interne dei grandi hyperscaler. In altre parole, fotografa la "domanda AI di coda lunga", non la "domanda AI totale". Se la coda lunga accelera, la domanda "di testa" potrebbe essere ancora più forte; oppure può darsi che la testa abbia già rallentato e la coda lunga stia solo recuperando. I due scenari hanno implicazioni d'investimento molto diverse.
Anche le tariffe di noleggio GPU osservate riflettono capacità di terze parti presso cloud provider non hyperscale ed escludono i listini ufficiali di AWS, Azure e GCP. L'aumento dei prezzi da parte dei terzi segnala che la carenza di calcolo si è estesa oltre i grandi player, un elemento positivo per il trend dell'hardware AI. Resta però ignoto il tasso di utilizzo effettivo degli hyperscaler: se la domanda interna fosse già satura e la capacità in eccesso non venisse immessa nel mercato del noleggio, l'equilibrio reale domanda-offerta potrebbe essere meno tirato di quanto suggeriscano questi dati.
Infine, la divergenza nei prezzi dello storage merita un'analisi dedicata. Con la NAND in calo da tre mesi e la DRAM ancora in rialzo, il quadro è coerente con una fase tardiva del ciclo della memoria. Se i prezzi NAND continueranno a scendere, le attese sui ricavi dei produttori di chip di memoria potrebbero essere riviste al ribasso, con effetti a catena sulle previsioni di capex lungo l'intero settore delle apparecchiature per semiconduttori.
Disclaimer
Questo articolo è una sintesi e interpretazione, a cura di Chaoxiang Research, di report di ricerca di broker terzi. I rating, i target price, le stime di utili e le valutazioni citate riflettono le opinioni degli analisti delle rispettive case e rappresentano le posizioni delle loro istituzioni; non riflettono le opinioni di Chaoxiang Research e non costituiscono consulenza d'investimento. I mercati comportano rischi; decidere in autonomia. Il presente testo non deve essere utilizzato come base per acquistare o vendere titoli.