高盛表示,Google/博通的TPU正在迅速縮小與英偉達GPU在推理成本上的差距。從TPU v6升級至TPU v7,單位代幣推理成本下降約70%,與英偉達GB200 NVL72基本持平。這並不意味着英偉達地位被動搖,但它清晰地表明,AI芯片競爭核心評價體系正在從「誰算得更快」,轉向「誰算得更便宜、更可持續」。
在AI資本開支仍維持高位、但商業化壓力不斷上升的當下,市場關注點正在發生一場悄然卻深刻的轉移:大模型還能不能繼續「無視成本地跑下去」。
據追風交易台,高盛最新發布的AI芯片研究報告,並未延續市場熟悉的「算力、製程、參數規模」對比,而是從更貼近商業現實的角度切入——推理階段的單位成本。通過構建一條「推理成本曲線」,高盛試圖回答一個對AI產業至關重要的問題:在模型進入高頻調用階段後,不同芯片方案在折舊、能耗和系統利用率等約束下,每處理一百萬個token究竟需要付出多少真實成本。
研究結論指向了一次正在加速、但尚未被充分消化的變化:Google/Broadcom 的TPU正在迅速縮小與英偉達GPU在推理成本上的差距。從TPU v6升級至TPU v7,單位token推理成本下降約70%,使其在絕對成本層面與英偉達GB200 NVL72基本持平,部分測算情形下甚至略具優勢。
這並不意味着 $英偉達 (NVDA.US)$ 的地位被動搖,但它清晰地表明,AI芯片競爭的核心評價體系正在從「誰算得更快」,轉向「誰算得更便宜、更可持續」。當訓練逐漸成爲前期投入,而推理成爲長期現金流來源,成本曲線的斜率,正在取代峰值算力,成爲決定產業格局的關鍵變量。
一、從算力領先到成本效率,AI芯片競爭的評價標準正在切換
在AI發展的早期階段,訓練算力幾乎決定了一切。誰能更快訓練出更大的模型,誰就擁有技術話語權。然而,隨着大模型逐步進入部署與商業化階段,推理負載開始遠遠超過訓練本身,成本問題被迅速放大。
高盛指出,在這一階段,芯片的性價比不再只由單卡性能決定,而是由系統層面的效率共同塑造,包括算力密度、互聯效率、內存帶寬以及能源消耗等多重因素。基於這一邏輯構建的推理成本曲線顯示,Google/Broadcom TPU在原始計算性能和系統效率上的進步,已經足以在成本維度上與英偉達正面競爭。
相比之下, $美國超微公司 (AMD.US)$ 和$亞馬遜 (AMZN.US)$Trainium在代際成本下降幅度上仍較爲有限。從現階段測算結果看,兩者的單位推理成本仍明顯高於英偉達和Google方案,對主流市場的衝擊相對有限。
二、TPU成本躍遷的背後,是系統工程能力而非單點突破
TPU v7實現大幅降本,並非來自單一技術突破,而是系統級優化能力的集中釋放。高盛認爲,隨着計算芯片本身逐步逼近物理極限,未來推理成本能否繼續下降,將越來越依賴「計算相鄰技術」的進步。
這些技術包括:更高帶寬、更低延遲的網絡互聯;高帶寬內存(HBM)和存儲方案的持續集成;先進封裝技術(如$台積電 (TSM.US)$CoWoS);以及機架級解決方案在密度與能效上的提升。TPU在這些方面的協同優化,使其在推理場景中展現出明顯的經濟性優勢。
這一趨勢也與谷歌自身的算力部署高度一致。TPU在Google內部工作負載中的使用比例持續上升,已廣泛用於Gemini模型的訓練與推理。同時,具備成熟軟件能力的外部客戶也在加速採用TPU方案,其中最引人注目的案例是Anthropic向Broadcom下達的約210億美元訂單,相關產品預計將在2026年中開始交付。
不過,高盛同時強調,英偉達仍然掌握「上市時間」優勢。在TPU v7剛剛追平GB200 NVL72之際,英偉達已經推進至GB300 NVL72,並計劃在2026年下半年交付VR200 NVL144。持續的產品迭代節奏,仍是其維持客戶黏性的關鍵籌碼。
三、投資含義再平衡:ASIC崛起,但英偉達的護城河尚未被擊穿
從投資視角看,高盛並未因TPU的快速追趕而下調對英偉達的判斷。該機構仍維持對英偉達與Broadcom的買入評級,認爲兩者最直接綁定AI資本開支中最具可持續性的部分,並將長期受益於網絡、封裝和系統級技術升級。
在ASIC陣營中,Broadcom的受益邏輯尤爲清晰。高盛已將其2026財年每股收益預期上調至10.87美元,較市場一致預期高出約6%,並認爲市場仍低估了其在AI網絡與定製計算領域的長期盈利能力。
AMD和亞馬遜Trainium當前仍處於追趕階段,但高盛也指出,AMD的機架級方案存在後發優勢的可能性。預計在2026年末,基於MI455X的Helios機架方案有望在部分訓練與推理場景中實現約70%的推理成本下降,值得持續跟蹤。
更重要的是,這份研報給出的並非「贏家通吃」的結論,而是一幅逐漸清晰的產業分工圖景:GPU繼續主導訓練與通用算力市場,而定製ASIC在規模化、可預測的推理負載中不斷滲透。在這一過程中,英偉達的CUDA生態與系統級研發投入仍構成堅實護城河,但其估值邏輯也將持續接受「推理成本下行」的現實檢驗。
當AI真正進入「每一個token都要算回報」的階段,算力競爭終究要回到經濟學本身。TPU成本暴降70%,並不是一次簡單的技術追趕,而是一次對AI商業模式可行性的關鍵壓力測試。而這,或許正是GPU與ASIC之爭背後,市場最應認真對待的信號。
編輯/rice