Relatório do JPMorgan: uso de LLM salta 70%, aluguel de GPUs sobe há sete meses e demanda por IA segue firme

Resumo de mercado por IA
Os dados do JPMorgan apontam para uma demanda sustentada por infraestrutura de IA: o uso de tokens de LLM aumentou 70% mês a mês, com apenas uma modesta erosão de preços, as taxas de aluguel de GPU subiram pelo sétimo mês consecutivo e os preços à vista de DRAM permanecem acentuadamente mais altos ano a ano. Isso sustenta a continuidade do aperto em computação e memória de alto padrão, beneficiando as principais cadeias de suprimento de hardware de IA. No entanto, três meses de enfraquecimento do NAND sugerem que o ciclo de armazenamento pode estar em estágio avançado, elevando o risco de futuras revisões de capex.
Nível de impacto
● Médio
Ativos afetados
NCSKNVDA2USD/USDT-0.50%
Insight de IA · NCSKNVDA2USD/USDTInsight de IA
▲ Altista
Negociar agora
⚠️ Os insights gerados por IA são baseados em conteúdo de notícias e fornecidos apenas para fins informativos. Eles não constituem aconselhamento de investimento nem representam as opiniões da BingX. Investir envolve riscos. Negocie com responsabilidade.
Por Rita Tide Guide O JPMorgan divulgou em 1º de julho seu relatório de leitura do mercado de data centers, acompanhando três indicadores de demanda por infraestrutura de IA: uso e preços de tokens de LLM, tarifas de aluguel de GPUs e preços à vista de chips de memória. A mensagem é direta: o ambiente de demanda por IA permanece favorável. Dados do OpenRouter mostram forte aceleração em junho. O uso de tokens avançou 70% na comparação mensal e ficou 20 vezes maior em relação ao mesmo período do ano anterior. Apesar do salto de volume, o preço por chamada subiu levemente mês a mês e recuou apenas 5% ano a ano; nos modelos baseados nos EUA, o preço subiu na comparação anual. O gasto total na plataforma aumentou 70% no mês e 16 vezes em um ano. Em conjunto, os números indicam que o crescimento de uso está muito acima da queda de preço. Na leitura do JPMorgan, mesmo que o preço dos tokens caia 5% a 10% ao ano, enquanto o volume continuar dobrando, a receita de inferência tende a crescer com força — uma dinâmica que favorece os provedores de modelos. O recorte por origem dos modelos também chama atenção: modelos dos EUA representam cerca de 35% do uso, mas concentram mais de 85% do gasto total. O Claude Opus 4.7, da Anthropic, foi o único a aparecer simultaneamente entre os cinco maiores em uso e entre os cinco maiores em gasto, sinalizando que o poder de precificação permanece nos EUA. No mercado de capacidade, as tarifas de aluguel de GPUs em provedores de nuvem fora do grupo hyperscale subiram de forma ampla em junho, marcando o sétimo mês consecutivo de alta. O A100 teve aumento de 6,3% e completou cinco meses seguidos de valorização. O H100 avançou 3,7%, mantendo a tendência de sete meses. O B200 subiu 2,7% e segue em alta desde o lançamento, há nove meses. No nível de preços, o B200 já custa o dobro do H100. As diferenças entre as faixas de GPUs estão diminuindo. O prêmio do H100 sobre o A100 caiu de 1,77x em abril para 1,67x em junho. O prêmio do B200 sobre o H100 recuou de 2,58x para 1,96x. O estreitamento sugere alívio gradual na escassez de computação de ponta, mas o fato de os preços continuarem subindo indica que a demanda tem acompanhado a expansão de oferta. A alta mais forte no A100 merece destaque: em vez de cair, o preço do chip de geração anterior avançou, sinalizando disputa por poder computacional com melhor custo-benefício entre clientes com restrições de orçamento. Para o banco, isso não é um quadro de excesso de oferta. Memória: DRAM acelera, NAND perde força No mercado de armazenamento, os movimentos divergem. O preço à vista de DRAM subiu 10% em junho, para US$ 43,14, acumulando alta de 740% em um ano e registrando três meses consecutivos de avanço. Já o NAND recuou 0,3% no mês, para US$ 27,03, estendendo uma sequência de três meses de pequenas quedas, embora ainda esteja 518% acima do nível de um ano atrás. Os percentuais mostram que os preços de armazenamento seguem em patamar historicamente elevado, mas com comportamentos distintos: DRAM em alta e NAND começando a ceder. Padrões históricos indicam que, quando o ciclo de armazenamento se aproxima do pico, o NAND tende a enfraquecer primeiro, seguido pelo DRAM. A fraqueza por três meses no NAND sugere que o ciclo pode estar em fase mais avançada. O JPMorgan não cravou essa conclusão, mas os dados apontam nessa direção. Em síntese, os três sinais — uso de LLM +70%, aluguel de GPUs em alta por sete meses e DRAM +740% ano a ano — reforçam a leitura de que a demanda por infraestrutura de IA ainda está longe do pico. Ao mesmo tempo, a estrutura está mudando: modelos dos EUA capturam mais de 85% do gasto, o prêmio do B200 sobre o H100 caiu de 2,58x para 1,96x e o NAND começa a afrouxar, reposicionando o ciclo de memória. Visão Tide O principal ponto cego do relatório é o viés das fontes. O OpenRouter atende majoritariamente desenvolvedores, startups e cenários de programação de agentes de IA, e não inclui tráfego direto de APIs da OpenAI e da Anthropic, nem uso interno de implementações em nuvens hyperscale. Na prática, o recorte captura a "demanda de cauda longa", não a "demanda total". Se a cauda longa acelera, a demanda do topo pode estar ainda mais aquecida — ou pode ter arrefecido, enquanto a cauda longa apenas alcança. As duas hipóteses implicam consequências de investimento muito diferentes. As tarifas de aluguel de GPUs refletem capacidade de terceiros fora do grupo hyperscale e não incluem preços oficiais de AWS, Azure e GCP. A alta nas cotações de terceiros sugere que a escassez de computação transbordou dos grandes players para a cauda longa, o que é positivo para a tese de hardware de IA, mas não revela a taxa de utilização dos hyperscalers. Se a demanda interna deles já estiver saturada e a capacidade excedente não tiver sido liberada ao mercado de aluguel, a relação real entre oferta e demanda pode ser mais fraca do que os indicadores sugerem. A divergência entre NAND e DRAM também exige leitura própria. Com NAND em queda por três meses e DRAM ainda subindo, o padrão é compatível com a fase final do ciclo de memória. Se o NAND continuar recuando, expectativas de receita de fabricantes de memória podem ser revisadas para baixo, afetando projeções de capex em toda a cadeia de equipamentos para semicondutores. Aviso legal Este texto reúne e interpreta relatórios de pesquisa de corretoras de terceiros compilados pela Chaoxiang Research. As avaliações, preços-alvo, projeções de lucro e demais julgamentos citados refletem as opiniões dos analistas das corretoras e as posições de suas instituições, não representam a visão da Chaoxiang Research e não constituem recomendação de investimento. O mercado envolve riscos; decisões devem ser tomadas de forma independente. Este material não deve ser usado como base para compra ou venda de quaisquer valores mobiliários.