Rapport JPMorgan : l'usage des LLM bondit de 70 %, les locations de GPU en hausse depuis sept mois, la demande IA reste solide

Résumé du marché par IA
Les données de JPMorgan indiquent une demande durable en infrastructures d'IA : l'utilisation des tokens des LLM a bondi de 70 % MoM avec seulement une érosion modeste des prix, les tarifs de location de GPU ont augmenté pour un septième mois consécutif, et les prix spot de la DRAM demeurent nettement plus élevés en glissement annuel. Cela soutient la poursuite de tensions sur le calcul et la mémoire haut de gamme, au bénéfice des principales chaînes d'approvisionnement en matériel d'IA. Cependant, trois mois d'assouplissement de la NAND suggèrent que le cycle du stockage pourrait être en phase tardive, augmentant le risque de révisions futures des dépenses d'investissement.
Niveau d'impact
● Moyen
Actifs concernés
NCSKNVDA2USD/USDT-0.50%
Infos de l'IA · NCSKNVDA2USD/USDTInfos de l'IA
▲ Haussier
Trader maintenant
⚠️ Les infos générées par l'IA sont basées sur des contenus d'actualité et fournies à titre informatif uniquement. Elles ne constituent pas des conseils en investissement et ne reflètent pas les positions de BingX. Investir comporte des risques. Tradez de manière responsable.
Rédigé par : Rita Tide Guide Dans une note publiée le 1er juillet, JPMorgan passe au crible la demande d'infrastructures IA via trois indicateurs : l'usage et les prix des tokens LLM, les tarifs de location des GPU, et les prix spot des puces mémoire. Verdict : l'environnement de demande reste favorable et la puissance de calcul IA est encore loin d'un pic. Selon les données d'OpenRouter, l'usage de tokens a progressé de 70 % sur un mois en juin et a été multiplié par 20 sur un an. Dans le même temps, le prix par requête a légèrement augmenté sur un mois mais ne recule que de 5 % sur un an, tandis que la tarification des modèles basés aux États-Unis est en hausse sur un an. Les dépenses totales ont grimpé de 70 % sur un mois et ont été multipliées par 16 sur un an. Ensemble, ces chiffres montrent que la croissance des volumes dépasse largement l'érosion des prix. JPMorgan estime que l'économie des tokens joue en faveur des fournisseurs de modèles : même avec une baisse annuelle des prix de 5 % à 10 %, tant que l'usage continue de doubler, les revenus d'inference peuvent fortement accélérer. La répartition de la demande illustre aussi un déséquilibre : les modèles américains ne représentent que 35 % de l'usage, mais captent plus de 85 % des dépenses. Anthropic Claude Opus 4.7 est le seul modèle présent à la fois dans le top 5 en usage et dans le top 5 en dépenses, ce qui suggère que le pouvoir de fixation des prix se situe principalement aux États-Unis. Côté calcul, les prix de location des GPU chez les fournisseurs cloud non "hyperscalers" ont progressé en juin sur l'ensemble de la gamme. Les A100 ont augmenté de 6,3 % (cinquième mois consécutif de hausse), les H100 de 3,7 % (septième mois d'affilée), et les B200 de 2,7 %, prolongeant une progression continue depuis leur lancement il y a neuf mois. Les B200 se louent désormais à un niveau environ deux fois supérieur aux H100. L'écart entre les trois paliers se réduit : la prime du H100 sur l'A100 est passée de 1,77x en avril à 1,67x en juin ; la prime du B200 sur le H100 a reculé de 2,58x à 1,96x. JPMorgan y voit un assouplissement de la rareté du très haut de gamme, sans détérioration des prix, signe que la demande continue d'absorber l'offre additionnelle. Le fait que l'A100 affiche la plus forte hausse est notable : l'ancien générationnel qui ne baisse pas mais monte traduit une concurrence accrue pour une puissance de calcul plus abordable, et non un excès d'offre. Sur la mémoire, les tendances divergent. Le prix spot du DRAM a gagné 10 % sur un mois en juin à 43,14 dollars, soit +740 % sur un an, troisième mois consécutif de hausse. Le NAND a légèrement reculé de 0,3 % sur un mois à 27,03 dollars, marquant un troisième mois de faiblesse, tout en restant en hausse de 518 % sur un an. Les niveaux restent historiquement élevés, mais la dynamique change : historiquement, en fin de cycle du stockage, le NAND s'affaiblit avant le DRAM. La séquence actuelle suggère une entrée dans une phase plus avancée du cycle, même si JPMorgan ne le formule pas explicitement. En synthèse, les trois signaux — usage des LLM (+70 %), locations de GPU en hausse depuis sept mois, DRAM à +740 % sur un an — convergent : la demande d'infrastructure IA reste robuste et loin de plafonner. La structure évolue : la dépense se concentre sur les modèles américains, la prime du B200 se contracte à mesure que la rareté du très haut de gamme se détend, et le cycle du stockage change de régime avec un NAND qui commence à se relâcher. Tide View Le principal angle mort du rapport tient à un biais de sources. OpenRouter sert surtout des développeurs, des startups et des cas d'usage orientés agents, sans inclure le trafic API direct d'OpenAI et d'Anthropic ni les déploiements internes des hyperscalers. Le rapport capte donc une "demande IA de longue traîne" plutôt que la demande totale. Si cette longue traîne s'accélère, la demande du "haut" pourrait être encore plus forte ; à l'inverse, il est possible que la demande des grands comptes se soit déjà tassée tandis que la longue traîne rattrape son retard. Les implications d'investissement diffèrent radicalement selon le scénario. Les prix de location des GPU suivis concernent aussi des capacités tierces hors hyperscalers et n'intègrent pas les grilles officielles d'AWS, d'Azure et de GCP. Le relèvement des prix par ces acteurs suggère que la tension en calcul s'étend au-delà des grands fournisseurs, signal favorable pour la tendance du matériel IA, mais sans informer sur les taux d'utilisation réels chez les hyperscalers. Si la demande interne y est déjà saturée et que des capacités excédentaires ne sont pas libérées vers le marché locatif, l'équilibre offre-demande pourrait être plus faible que ne le suggèrent ces données. Enfin, la divergence mémoire mérite un suivi spécifique : trois mois de baisse du NAND alors que le DRAM continue de monter correspondent souvent à une phase tardive du cycle. Si la baisse du NAND se prolonge, les attentes de revenus des fabricants de mémoire pourraient être revues à la baisse, avec un effet en chaîne potentiel sur les prévisions de capex dans l'ensemble des équipements pour semi-conducteurs. Avertissement Cet article compile et interprète des rapports de recherche de courtiers tiers par Chaoxiang Research. Les notations, objectifs de cours, prévisions de résultats et jugements cités reflètent les opinions des analystes des maisons concernées et ne représentent pas les vues de Chaoxiang Research ; ils ne constituent pas un conseil en investissement. Les marchés comportent des risques ; décidez en toute indépendance. Ce texte ne doit pas servir de base à l'achat ou à la vente de titres.