成本暴降70%！谷歌TPU強勢追趕，性價比已追平英偉達

華爾街見聞 · 01/21 12:58

高盛表示，Google/博通的TPU正在迅速縮小與英偉達GPU在推理成本上的差距。從TPU v6升級至TPU v7，單位代幣推理成本下降約70%，與英偉達GB200 NVL72基本持平。這並不意味着英偉達地位被動搖，但它清晰地表明，AI芯片競爭核心評價體系正在從「誰算得更快」，轉向「誰算得更便宜、更可持續」。

在AI資本開支仍維持高位、但商業化壓力不斷上升的當下，市場關注點正在發生一場悄然卻深刻的轉移：大模型還能不能繼續「無視成本地跑下去」。

據追風交易台，高盛最新發布的AI芯片研究報告，並未延續市場熟悉的「算力、製程、參數規模」對比，而是從更貼近商業現實的角度切入——推理階段的單位成本。通過構建一條「推理成本曲線」，高盛試圖回答一個對AI產業至關重要的問題：在模型進入高頻調用階段後，不同芯片方案在折舊、能耗和系統利用率等約束下，每處理一百萬個token究竟需要付出多少真實成本。

研究結論指向了一次正在加速、但尚未被充分消化的變化：Google/Broadcom 的TPU正在迅速縮小與英偉達GPU在推理成本上的差距。從TPU v6升級至TPU v7，單位token推理成本下降約70%，使其在絕對成本層面與英偉達GB200 NVL72基本持平，部分測算情形下甚至略具優勢。

這並不意味着 $英偉達 (NVDA.US)$ 的地位被動搖，但它清晰地表明，AI芯片競爭的核心評價體系正在從「誰算得更快」，轉向「誰算得更便宜、更可持續」。當訓練逐漸成爲前期投入，而推理成爲長期現金流來源，成本曲線的斜率，正在取代峰值算力，成爲決定產業格局的關鍵變量。

一、從算力領先到成本效率，AI芯片競爭的評價標準正在切換

在AI發展的早期階段，訓練算力幾乎決定了一切。誰能更快訓練出更大的模型，誰就擁有技術話語權。然而，隨着大模型逐步進入部署與商業化階段，推理負載開始遠遠超過訓練本身，成本問題被迅速放大。

高盛指出，在這一階段，芯片的性價比不再只由單卡性能決定，而是由系統層面的效率共同塑造，包括算力密度、互聯效率、內存帶寬以及能源消耗等多重因素。基於這一邏輯構建的推理成本曲線顯示，Google/Broadcom TPU在原始計算性能和系統效率上的進步，已經足以在成本維度上與英偉達正面競爭。

相比之下， $美國超微公司 (AMD.US)$ 和$亞馬遜 (AMZN.US)$Trainium在代際成本下降幅度上仍較爲有限。從現階段測算結果看，兩者的單位推理成本仍明顯高於英偉達和Google方案，對主流市場的衝擊相對有限。

二、TPU成本躍遷的背後，是系統工程能力而非單點突破

TPU v7實現大幅降本，並非來自單一技術突破，而是系統級優化能力的集中釋放。高盛認爲，隨着計算芯片本身逐步逼近物理極限，未來推理成本能否繼續下降，將越來越依賴「計算相鄰技術」的進步。

這些技術包括：更高帶寬、更低延遲的網絡互聯；高帶寬內存（HBM）和存儲方案的持續集成；先進封裝技術（如$台積電 (TSM.US)$CoWoS）；以及機架級解決方案在密度與能效上的提升。TPU在這些方面的協同優化，使其在推理場景中展現出明顯的經濟性優勢。

這一趨勢也與谷歌自身的算力部署高度一致。TPU在Google內部工作負載中的使用比例持續上升，已廣泛用於Gemini模型的訓練與推理。同時，具備成熟軟件能力的外部客戶也在加速採用TPU方案，其中最引人注目的案例是Anthropic向Broadcom下達的約210億美元訂單，相關產品預計將在2026年中開始交付。

不過，高盛同時強調，英偉達仍然掌握「上市時間」優勢。在TPU v7剛剛追平GB200 NVL72之際，英偉達已經推進至GB300 NVL72，並計劃在2026年下半年交付VR200 NVL144。持續的產品迭代節奏，仍是其維持客戶黏性的關鍵籌碼。

三、投資含義再平衡：ASIC崛起，但英偉達的護城河尚未被擊穿

從投資視角看，高盛並未因TPU的快速追趕而下調對英偉達的判斷。該機構仍維持對英偉達與Broadcom的買入評級，認爲兩者最直接綁定AI資本開支中最具可持續性的部分，並將長期受益於網絡、封裝和系統級技術升級。

在ASIC陣營中，Broadcom的受益邏輯尤爲清晰。高盛已將其2026財年每股收益預期上調至10.87美元，較市場一致預期高出約6%，並認爲市場仍低估了其在AI網絡與定製計算領域的長期盈利能力。

AMD和亞馬遜Trainium當前仍處於追趕階段，但高盛也指出，AMD的機架級方案存在後發優勢的可能性。預計在2026年末，基於MI455X的Helios機架方案有望在部分訓練與推理場景中實現約70%的推理成本下降，值得持續跟蹤。

更重要的是，這份研報給出的並非「贏家通吃」的結論，而是一幅逐漸清晰的產業分工圖景：GPU繼續主導訓練與通用算力市場，而定製ASIC在規模化、可預測的推理負載中不斷滲透。在這一過程中，英偉達的CUDA生態與系統級研發投入仍構成堅實護城河，但其估值邏輯也將持續接受「推理成本下行」的現實檢驗。

當AI真正進入「每一個token都要算回報」的階段，算力競爭終究要回到經濟學本身。TPU成本暴降70%，並不是一次簡單的技術追趕，而是一次對AI商業模式可行性的關鍵壓力測試。而這，或許正是GPU與ASIC之爭背後，市場最應認真對待的信號。

編輯/rice

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與象象銀行相關的任何投資建議。象象銀行竭力但無法保證上述全部內容的真實性、準確性和原創性。