Nvidia Blackwell:每兆瓦可運行AI代理數量較Hopper提升20倍
Nvidia新一代Blackwell架構在效能與能效上不再只是"小改款"。最新基準測試AgentPerf顯示,Blackwell系統每兆瓦可同時運行的AI代理(AI agents)數量,是Nvidia上一代Hopper的20倍。換言之,過去Hopper硬件可支撐1個AI代理的用電量,現可在Blackwell上支撐20個。
■ 基準與數據:20倍與更高吞吐對照
AgentPerf由Artificial Analysis於2026年3月以AAAgentPerf名義推出,主打量度真實世界的代理型工作負載表現,評估指標包括每個加速器可承載的並發用戶數,以及每個機架的效率等。
這項"20倍每兆瓦代理"結果,亦與SemiAnalysis的InferenceX能效數據方向一致。SemiAnalysis在2026年2月指出,Blackwell的GB300 NVL72配置在每兆瓦吞吐量方面最高可較Hopper提升50倍;同一份報告亦提到,對於代理式推理(agentic reasoning)等複雜AI工作負載,每token成本可降低35倍。
■ 架構改動:耗電更高,但每瓦工作量大增
帶動提升的硬件因素包括多項架構更新:Blackwell採用FP4精度、第二代Transformer Engine,以及更先進的NVLink設計,令GPU在系統內的互聯溝通更快。單顆Blackwell GPU功耗約1,200至1,400瓦,較H100晶片約700瓦高出不少。能效躍升並非來自"每顆晶片更省電",而是每消耗1瓦能完成的工作量大幅提高。
■ 代理式AI帶來的變化:電力成為數據中心硬約束
Nvidia行政總裁黃仁勳在2025年末曾提及這一趨勢,並披露Blackwell銷售明顯超出預期,當中推理(inference)與代理式AI被點名為重要增長動力。隨着數據中心愈來愈受制於供電上限,若每兆瓦可承載的AI代理數量提升20倍,企業便可在不新增電力基建的情況下,將AI部署規模放大20倍,AI代理的單位經濟效益亦會同步重估。
■ 對投資者的含意:能效提升擴大TAM,但加密概念仍缺乏直接關聯
若單一世代即可帶來20至50倍的能效改善,往往意味可行應用場景增加,令原本不合算的用例轉為具經濟性,並擴大可服務市場(TAM)。每token成本下降35倍,理論上可令個人化財務顧問、即時供應鏈優化、或自動化客戶服務等應用更易在大規模下落地。
市場亦有人把Nvidia在AI基建的主導地位,聯繫到部分"AI相關"加密代幣,例如TAO、NEAR、ICP及RNDR。不過,目前未有證據顯示這些代幣與AgentPerf基準,或Blackwell的表現聲稱存在任何直接關聯。
另一方面,AMD、Intel以及愈來愈多自研晶片(custom silicon)初創,正加速追趕Nvidia在推理市場的份額。對數據中心營運者而言,"每兆瓦能承載多少代理"屬關鍵指標;Blackwell在該指標上取得20倍優勢,意味其領先幅度仍相當可觀。