Báo cáo JPMorgan: Lượng dùng LLM tăng vọt 70%, giá thuê GPU leo thang 7 tháng liên tiếp, nhu cầu AI vẫn vững

Tóm tắt thị trường bằng AI
Dữ liệu của JPMorgan cho thấy nhu cầu hạ tầng AI duy trì: mức sử dụng token LLM tăng 70% MoM với mức xói mòn giá chỉ ở mức khiêm tốn, giá thuê GPU tăng tháng thứ bảy liên tiếp, và giá giao ngay DRAM vẫn cao hơn rõ rệt so với cùng kỳ năm trước. Điều này củng cố tình trạng thắt chặt tiếp diễn ở mảng năng lực tính toán và bộ nhớ cao cấp, có lợi cho các chuỗi cung ứng phần cứng AI hàng đầu. Tuy nhiên, ba tháng NAND suy yếu cho thấy chu kỳ lưu trữ có thể đang ở giai đoạn cuối, làm gia tăng rủi ro điều chỉnh capex trong tương lai.
Mức ảnh hưởng
● Trung bình
Tài sản bị ảnh hưởng
NCSKNVDA2USD/USDT-0.50%
Quan điểm AI · NCSKNVDA2USD/USDTQuan điểm AI
▲ Giá tăng
Khám phá ngay
⚠️ Nhận định từ AI được tổng hợp từ tin tức và chỉ có giá trị tham khảo. Đây không phải là lời khuyên đầu tư và không thể hiện quan điểm của BingX. Đầu tư luôn đi kèm rủi ro. Vui lòng giao dịch có trách nhiệm.
Báo cáo "góc nhìn trung tâm dữ liệu" của JPMorgan công bố ngày 1/7 theo dõi ba chỉ báo về nhu cầu hạ tầng AI: mức sử dụng token và giá token của LLM, giá thuê GPU và giá giao ngay chip bộ nhớ. Bức tranh tổng thể cho thấy môi trường nhu cầu AI vẫn tích cực. Theo dữ liệu từ OpenRouter, lượng token sử dụng trong tháng 6 tăng 70% so với tháng trước và cao gấp 20 lần so với cùng kỳ. Dù mức sử dụng tăng mạnh, giá chỉ giảm nhẹ: giá mỗi lượt gọi tăng nhẹ theo tháng, còn tính theo năm chỉ giảm 5%. Với các mô hình đặt tại Mỹ, mức giá thậm chí tăng so với cùng kỳ. Nhờ đó, tổng chi tiêu trên nền tảng tăng 70% theo tháng và gấp 16 lần theo năm. JPMorgan nhận định tốc độ tăng sử dụng vượt xa mức giảm giá, khiến kinh tế học token tiếp tục nghiêng về phía nhà cung cấp mô hình; ngay cả khi giá token giảm 5%–10% mỗi năm, chỉ cần nhu cầu tiếp tục tăng gấp đôi, doanh thu suy luận vẫn có thể tăng mạnh. Cấu trúc chi tiêu cũng cho thấy quyền định giá tập trung ở Mỹ: các mô hình Mỹ chỉ chiếm 35% lượng sử dụng nhưng nắm hơn 85% tổng chi tiêu. Anthropic Claude Opus 4.7 là mô hình duy nhất lọt top 5 cả về mức sử dụng lẫn chi tiêu. Ở mảng phần cứng, giá thuê GPU từ các nhà cung cấp đám mây không thuộc nhóm hyperscale tiếp tục đi lên trong tháng 6 và đánh dấu xu hướng tăng kéo dài. A100 tăng 6,3%, ghi nhận 5 tháng tăng liên tiếp; H100 tăng 3,7%, kéo dài chuỗi tăng 7 tháng; B200 tăng 2,7% và duy trì đà tăng kể từ khi ra mắt cách đây 9 tháng. Hiện giá B200 đã cao gấp đôi H100. Khoảng cách giá giữa các tầng GPU đang thu hẹp: mức chênh H100 so với A100 giảm từ 1,77x trong tháng 4 xuống 1,67x trong tháng 6; mức chênh B200 so với H100 giảm từ 2,58x xuống 1,96x. JPMorgan cho rằng tình trạng khan hiếm năng lực tính toán cao cấp có dấu hiệu dịu bớt, nhưng việc giá vẫn tăng cho thấy tăng trưởng nhu cầu đang theo kịp nguồn cung bổ sung. Đáng chú ý, A100 (thế hệ cũ hơn) lại tăng mạnh nhất, hàm ý nhóm khách hàng nhạy cảm ngân sách đang cạnh tranh để mua năng lực tính toán có chi phí/hiệu năng tốt, không phải dấu hiệu dư cung. Với bộ nhớ, giá giao ngay DRAM tăng 10% trong tháng 6 lên 43,14 USD, tăng 740% so với cùng kỳ và là tháng tăng thứ ba liên tiếp. Ngược lại, NAND giảm nhẹ 0,3% theo tháng xuống 27,03 USD, kéo dài ba tháng giảm nhẹ, dù vẫn cao hơn 518% so với cùng kỳ. Các mức 740% và 518% cho thấy mặt bằng giá lưu trữ vẫn ở vùng rất cao lịch sử, đồng thời xuất hiện phân kỳ: DRAM tiếp tục đi lên trong khi NAND bắt đầu hạ nhiệt. Theo khuôn mẫu chu kỳ trước đây, khi chu kỳ lưu trữ tiến đến đỉnh, NAND thường yếu trước rồi mới đến DRAM; ba tháng suy yếu của NAND gợi ý chu kỳ đã sang giai đoạn muộn hơn. Tổng hợp ba điểm dữ liệu: LLM tăng 70%, giá thuê GPU tăng 7 tháng liên tiếp, DRAM tăng 740% theo năm, JPMorgan kết luận nhu cầu hạ tầng AI vẫn chưa đạt đỉnh. Dẫu vậy, cấu trúc đang thay đổi: quyền định giá nghiêng về các mô hình Mỹ; chênh lệch giá B200/H100 thu hẹp phản ánh nguồn cung tính toán cao cấp bớt căng; NAND mềm đi báo hiệu chu kỳ bộ nhớ chuyển pha. Tide View (góc nhìn phân tích) Điểm mù lớn của báo cáo nằm ở thiên lệch nguồn dữ liệu. OpenRouter chủ yếu phục vụ nhà phát triển, startup và các kịch bản lập trình AI agent, không bao gồm lưu lượng API trực tiếp từ OpenAI và Anthropic, cũng như mức sử dụng từ các triển khai nội bộ của hyperscale cloud. Vì vậy, báo cáo phản ánh "nhu cầu AI ở phần đuôi dài", không phải "tổng nhu cầu AI". Nếu nhu cầu đuôi dài bùng nổ, phần "đầu" có thể còn nóng hơn; nhưng cũng có khả năng phần đầu đã hạ nhiệt và đuôi dài chỉ đang bắt kịp, kéo theo hàm ý đầu tư hoàn toàn khác nhau. Tương tự, giá thuê GPU trong báo cáo theo dõi năng lực từ các nhà cung cấp không thuộc hyperscale và không bao gồm mức giá chính thức từ AWS, Azure, GCP. Việc bên thứ ba tăng giá cho thấy thiếu hụt compute có thể đã lan từ nhóm lớn sang phần đuôi dài, tích cực cho xu hướng phần cứng AI, nhưng không phản ánh mức sử dụng thực tế của các hyperscaler. Nếu nhu cầu nội bộ của họ đã bão hòa và họ chỉ chưa đưa công suất dư ra thị trường cho thuê, trạng thái cung'cầu thực có thể yếu hơn so với tín hiệu mà dữ liệu thể hiện. Phân kỳ giá lưu trữ cũng cần theo dõi riêng. NAND giảm ba tháng liên tiếp trong khi DRAM vẫn tăng phù hợp đặc trưng giai đoạn muộn của chu kỳ. Nếu NAND tiếp tục giảm, kỳ vọng doanh thu của các hãng bộ nhớ có thể bị điều chỉnh xuống, từ đó ảnh hưởng dự báo chi tiêu vốn trên toàn bộ chuỗi thiết bị bán dẫn. Tuyên bố miễn trừ trách nhiệm Bài viết là phần tổng hợp và diễn giải của Chaoxiang Research dựa trên các báo cáo nghiên cứu của bên thứ ba. Các đánh giá, giá mục tiêu, dự báo lợi nhuận và các nhận định liên quan được trích dẫn là quan điểm của các nhà phân tích thuộc các công ty chứng khoán tương ứng, không phản ánh quan điểm của Chaoxiang Research và không cấu thành khuyến nghị đầu tư. Thị trường tiềm ẩn rủi ro; nhà đầu tư tự đưa ra quyết định. Nội dung này không nên được dùng làm căn cứ mua hoặc bán bất kỳ chứng khoán nào.