①創始人Jonathan Ross曾是谷歌TPU項目的核心研發成員;②Groq的核心產品LPU主要用於加快大語言模型完成推理相關任務的速度;③Groq LPU並不是完美的,其面臨成本與通用性面臨挑戰。
當地時間週三(12月24日),被視作 $英偉達 (NVDA.US)$ 「挑戰者」的Groq在官網宣佈,與英偉達達成一項 「非獨家授權協議」。Groq創始人兼CEO Jonathan Ross、總裁Sunny Madra等核心高管及團隊將加入英偉達。
這不是一次對公司整體的收購。英偉達支付約200億美元現金,獲得了Groq的核心AI推理技術知識產權和相關資產,而Groq的雲服務業務(Groq Cloud)將繼續獨立運營。
這被認爲是科技巨頭爭奪頂級AI人才與技術的典型方式,能以繞過複雜反壟斷審查的形式,快速獲取關鍵創新。對於Groq而言,這可能意味着其獨立的硬件挑戰者征程告一段落,但其核心技術將在英偉達的生態中獲得更廣闊的開發平台。
Groq是專攻AI推理芯片的明星初創公司,成立於2016年,總部位於美國加利福尼亞,創始人Jonathan Ross曾是谷歌自研AI芯片TPU(張量處理單元)項目的核心研發成員,部分谷歌前TPU團隊成員也跟隨他加入了Groq。
Jonathan Ross作爲谷歌第一代張量處理單元(TPU)項目的核心研發人員,深度參與了專爲AI優化的芯片設計。這個項目後來被用於擊敗圍棋冠軍李世石的AlphaGo比賽,也是Google AI服務的關鍵硬件。2016年,他帶領谷歌TPU團隊10名核心成員中的7位一同離職,創立了Groq。當時他發現,傳統計算架構(如CPU/GPU)無法高效處理現代AI任務,這一認知促使他決定創辦一家突破傳統限制的公司。

Groq的核心產品是LPU(語言處理單元),這類芯片主要用於加快大語言模型完成推理相關任務的速度,被外界視爲英偉達GPU替代方案之一。

2024年2月,Groq推出了一款全新的AI芯片,聲稱實現了「地表最強推理」——在Groq上運行大模型的推理速度較英偉達GPU提高10倍甚至更高。
2025年11月,美國白宮和美國能源部的最新聲明顯示,24家頂尖的人工智能企業已與美國政府簽署協議,加入「創世紀計劃」,英偉達和Groq都位列其中。
目前,Groq已與Meta合作爲其Llama API提供推理加速;與IBM合作整合其AI推理平台;與沙特阿美簽署巨額協議,計劃建設大型AI推理數據中心。
Groq LPU:推理速度驚人但成本高昂
驚人的推理速度、差異化的技術路線被視作Groq LPU安身立命的根本。在Llama、Mixtral等大模型上,其文本生成速度(每秒可達500個token)曾引發廣泛關注,被認爲遠超同期GPU。
另外, Groq LPU的工作原理與英偉達的GPU不同,它採用了名爲時序指令集計算機(Temporal Instruction Set Computer)架構,使用存儲器爲靜態隨機存取存儲器(SRAM),其速度比GPU所用的高帶寬存儲器(HBM)快約20倍。
從芯片的規格中,SRAM容量是230MB,帶寬80TB/s,FP16的算力是188TFLOPs。這一區別造成了 LPU和GPU在生成速度的差別。據Groq表示,英偉達GPU生成每個tokens需要約10焦耳(J)到30焦耳,而 Groq 僅需1焦耳到3焦耳。
但Groq LPU並不是完美的,其面臨成本與通用性面臨挑戰,爲運行大模型所需的龐大集群帶來了高昂的購置和運維成本,且專用芯片難以靈活適應快速迭代的AI算法。
前阿里巴巴集團副總裁、Lepton AI創始人兼CEO 賈揚清曾在社交平台上表示,由於每一張Groq卡的內存容量僅爲230MB,因此在運行Llama-2 70B模型時,需要305-572張Groq卡才足夠,而用H100則只需要8張卡。
賈揚清認爲,如果按未來運行三年的成本算,Groq的硬件採購成本是1144萬美元,運營成本至少要76.2萬美元。從目前的價格來看,這意味着在同等吞吐量下,這幾乎是H100硬件成本的40倍、能耗成本的10倍。
不止是成本高昂。SRAM技術面積大、功耗比較高,早就以IP內核形式集成到SoC(系統級芯片)裏面,並非單獨用,遠不如HBM的未來發展潛力。業內人士表示,綜合來看,不管是比單位容量價格、還是性能和功耗,英偉達GPU所使用的HBM技術都優於SRAM。
估值飆升至69億美元 去年營收9000萬美元
目前,Groq已完成多輪融資,最新估值約69億美元。
2017年:種子輪1030萬美元。
2021年:C輪融資3億美元,估值超過10億美元,成爲獨角獸。
2024年8月:完成由貝萊德(BlackRock)領投的6.4億美元D輪融資,估值達到28億美元。
2025年9月:完成新一輪7.5億美元戰略融資,估值躍升至約69億美元。
Groq背後既有頂級的跨國金融機構,也有領先的科技產業巨頭,還有活躍的風險投資基金:
金融機構作爲基石:貝萊德、路博邁等全球頂級資產管理公司多次參與大額融資,還包括D1資本、Altimeter Capital、1789 Capital。
產業資本深度參與:三星、思科、德國電信資本合夥公司(DTCP)等產業巨頭的投資不僅是財務行爲,更是戰略合作。例如,這可能涉及到芯片生產、數據中心部署或市場渠道的合作。
專業基金持續領投:Disruptive(長期領投方)、Infinitum,其中,以Disruptive爲代表的風險投資基金,在2025年的最新一輪7.5億美元融資中擔任領投方。
不過,近70億美元的估值與2024年9000萬美元的營收相比,溢價極高。
其2025年營收預期已大幅下調。2025年7月,Groq將其2025年的收入預期從20億美元大幅下調至5億美元。原因可能與部分大額訂單(如與沙特阿拉伯的協議)交付延遲,以及數據中心建設進度有關。
Groq此前告知投資者,其2026年收入將增至近12億美元(約合人民幣86億元),到2027年將超過19億美元(約合人民幣136億元),主要來自向其他公司直接銷售硬件。
截至2025年中,Groq手頭現金流超過20億美元,該公司資金儲備依然充足,支撐其後續擴張。
想選股、想診股?想知持倉機會同風險?關於投資的一切問題,開口問牛牛AI就得啦!
編輯/rice
