share_log

被英偉達200億美元「收編」!Groq創始人喬納森·羅斯最值得聽的一場深度對話

聰明投資者 ·  00:24
  1. 與其問「AI是不是泡沫」,不如問「聰明的錢在做什麼」。谷歌在做什麼?微軟在做什麼?亞馬遜呢?還有一些國家在做什麼?答案是:他們都在大舉押注AI。

  2. 我敢說,如果今天給OpenAI和Anthropic的推理算力都翻一倍,那麼從現在起一個月內,他們的收入幾乎就能翻倍。

  3. 很多人無法真正理解「速度」在人類體驗中的本能重要性。

  4. 我覺得做芯片有個誤區:很多人以爲最難的是把芯片造出來。但真正做下去之後,你會發現:最難的是軟件。然後你繼續做,就會意識到:真正最難的是跟得上行業的演進。

  5. 如果從價值的角度來看,或者說從「長期稱重機」的角度來看,經濟中最有價值的,其實是勞動力。而現在,通過提供更強的算力和更好的AI,我們實際上能夠向整個經濟體系裏注入更多「額外勞動力」。這種事情,在人類經濟史上從未發生過。

  6. 你應該讓品牌信任度維持在儘可能高的水平,因爲信任是有複利效應的。同樣的道理,我認爲利潤率也應該低到一個水平,讓客戶覺得你始終在給他們一個好價格。

  7. 如果五年後它(英偉達)還沒到(10萬億美元市值),我會很驚訝。

聖誕節英偉達爆出一則重磅新聞,將以約200億美元收購AI芯片初創公司Groq,同時把創始人等核心高管納入麾下,又讓Groq與喬納森的名字成爲「引爆點」。2016年成立的Groq,在今年9月中旬剛完成新一輪融資,融資額約7.5億美元,對應投後估值約69億美元。

隨着一些細節披露,業界分析普遍認爲,這筆交易實質上是英偉達通過「技術授權+人才收編+資產整合」來收編潛在競爭對手Groq,而不是傳統股權併購,有助於繞開嚴格的反壟斷審查、加快落地,同時又阻止Groq技術落入其他巨頭手中。

根據英偉達CEO黃仁勳在內部郵件中所述,此次交易的戰略目標十分明確:計劃將Groq的低延遲處理器整合到英偉達的「AI工廠」架構中。此舉旨在彌補英偉達自身在AI推理領域的結構性短板,以服務更廣泛的AI推理和實時工作負載。

Groq的核心競爭力在於其專爲AI推理設計的LPU芯片,其脫離了CUDA生態,而且用喬納森·羅斯的話說,「我們最大的賣點之一是:供應鏈跟GPU的完全不一樣。」

無論如何,這筆交易被外界視爲英偉達有史以來最大手筆之一,也足以說明一件事:推理算力的供給與效率,正在成爲新一輪競賽的核心變量。

是時候把喬納森·羅斯的一場深度對話,呈現給大家。這場對話正好發生於Groq融資之後的9月底,也是幫助我們理解AI浪潮底層邏輯的珍貴窗口。

他的判斷之所以值得咀嚼,不只因爲身處風口中央,更因爲他的職業背景。

在創辦Groq之前,喬納森曾是谷歌TPU的核心締造者之一,他對芯片研發週期、一次流片成功率、以及所謂「時間護城河」的理解,不是站在紙面上談戰略,而是建立在工程落地與供應鏈週期這些剛性約束之上。

在與哈里·斯特賓斯(Harry Stebbings)的對話中,喬納森不斷把話題callback到一個現實的問題:算力根本不夠。並提到,市場至今仍在大量租用發佈已久的H100,因爲只要供不應求,舊芯片依然能持續盈利。

喬納森說話直言不諱,表達精妙,很多觀點非常值得一看,也有一些看法有點反直覺。

包括他用快消品來類比人類基因中對速度有本能的需求,以及談到利潤的意義在於「讓公司有實力留在牌桌上」,以及用「稱重器」的方式看待AI所以沒有投資比特幣等等,都讓人聽出絲絲價值投資者熟悉的味道。而點評美股七巨頭的內容,也格外精闢。

聰明的錢都在大舉押注AI

哈里 我想從一個基本的問題開始,搞清楚我們現在究竟處在什麼階段。感覺這個世界變化速度比以往任何時候都更快。如果我們看當下的市場狀態,你怎麼判斷?

喬納森 你是想問,現在是不是有泡沫,對吧?

哈里 算是吧。

喬納森 關於「有沒有泡沫」這個問題,我的看法是:如果你反覆問一個問題,卻一直得不到清晰答案,也許你該換個問題來問。與其問「是不是泡沫」,不如問「聰明的錢在做什麼」。

谷歌在做什麼?微軟在做什麼?亞馬遜呢?還有一些國家在做什麼?

答案是:他們都在大舉押注AI。他們的資本開支越來越多,幾乎每一輪宣佈投入的時候,金額都會比上一輪更高。

而這些投資所帶來的價值,有個很有說服力的例子,就是微軟:他們在某個季度部署了一批GPU,之後宣佈這些GPU不會開放給Azure客戶使用,因爲他們自己用這些GPU賺的錢,比租出去賺得更多。

可見這個市場確實有巨大的商業潛力的。

要我說,現在這個市場特別像早期的石油鑽探,遍地枯井卻也偶見噴湧。

我聽到的一個數據,目前AI領域中,大概有35或36家公司貢獻了99%的收入,或者至少是99%的token消耗。

哈里 對,市場非常集中。我甚至有點意外,這個數字居然不是更少。說真的,你看英偉達,它的收入集中度也太高了,兩個客戶可能就佔了絕大部分營收。

喬納森 是啊,英偉達可能就佔了那99%裏的98%。

但當市場集中到這種程度時,說明它還處在非常早期的階段。就像過去人們不知道怎麼找油,只能靠直覺,幾乎是靠感覺投資。那些直覺好的人會大賺一筆,其他人可能血本無歸。

但隨着時間推移,這會逐漸變成一門科學。它會變得更可預測、更穩定,市場也會變得更均衡。

但到了那個階段,投資者的收益反而會下降,特別是那些本來能賺大錢的人,機會反而變少。

所以,我認爲現在恰恰是投資人最好的時機。現在人們在AI上的整體收入多過支出,只是這個分佈極其不均勻。

哈里 你是說,總體上賺得比花得多?

喬納森 對,整體看是這樣的,當然還是會有很多人賠得很慘,但總體來說,投入的資金少於產出的收益。

哈里 但你看看現在這些大廠的資本開支,每一家的反應都是「好,好,好」,因爲他們相信,終點一定會有實實在在的成果。但問題是,資本開支還在不斷上漲。

喬納森 沒錯。哪怕你純粹從財務角度考慮,我認爲財務回報也是積極的。而現在很多人之所以願意投入,真正的出發點並不是爲了賺錢。

我前陣子去阿布扎比,參加了高盛在那兒辦的首屆活動(我們現在也在贊助邁凱倫車隊)。

活動上,扎克·布朗(Zak Brown)有發言,我也發了言,現場氣氛挺不錯。然後有人問了我一個類似的問題:「AI是不是一個泡沫?」

我沒有直接回答,而是問了全場一個問題:在座的各位,有誰能百分百確信,十年後AI不可能替代你的工作?

在場有五十多位資產管理規模超過100億美元的投資人,沒有一個人舉手。

我說:「很好,這就是科技巨頭們現在的真實想法。」

所以他們會像喝醉的水手一樣繼續瘋狂砸錢,否則另一種可能性就是,他們會被徹底擋在覈心業務之外。

他們現在根本不是在算經濟賬,而是在回答一個更關鍵的問題:我們能不能保住行業的主導地位?

接下來的發展,會越來越體現規模法則的影響。如果你沒法留在前十名,你就沒有定價權。

我們現在常說「美股七巨頭」,如果你不在這七家裏,你甚至連那個估值區間都不可能靠近。

那你要怎麼保住這個位置?就得持續投入。

而只要你還在前七或前十,市場就會給你高估值,所以這筆投入是值得的。

哈里 但問題是,最終這些投入必須兌現成真正的、實打實的營收。如果兌現不了,那你是不是「七巨頭」其實也就無所謂了,對吧?

喬納森 你說得對。但現實是,AI已經開始釋放巨大的價值了。只是這個價值在各類應用中分佈得很不均勻,但它確實創造了巨大的價值。

我舉個我們自己親身經歷的例子。

我嘗試過通過prompt(提示)來編碼。我自己寫得不算好,但我們有幾個實習生非常擅長。

有一次,一個客戶來訪,我和他們開了個會,他們現場提了一個功能需求。

我用很粗略、提示的方式描述了這個功能,然後把這些prompt給到工程師們。結果四個小時後,這個功能就上線了。整個過程中,沒有一行代碼是人手寫的,也沒有人調試,全是通過prompt完成的。

我們現在用Slack集成了提交代碼的功能,所有操作就是在Slack裏完成的。四小時後,功能就交付使用了。

你想想這個效率帶來的價值有多大!

但如果你再往前想,六個月後,也許這個功能在客戶會議還沒結束之前就能完成上線,那就不僅是效率的差別,而是質的飛躍了,而不僅僅是節省了多少成本這麼簡單。

當然,從財務角度看,開發速度越快,你把功能推向生產環境所花的錢就越少,這是真金白銀的投入產出比(ROI)。

但從「質」的角度看,當你能做到在客戶會議結束前就把需求變成現實,你就能拿下那些競爭對手永遠也拿不下的訂單。

現在算力的需求是瘋狂且無法被滿足

哈里 我想回到「美股七巨頭」這個話題。你覺得大家是否都意識到,要想保住七巨頭的位置,就必須深入到芯片層,真正實現從頭到尾的垂直整合?

喬納森 我覺得你不會看到太多公司在芯片層成功突圍。

很多人把谷歌的TPU看作一個巨大的成功,但他們不知道的是,谷歌其實當時同時在搞三種芯片項目,最後只有一種跑贏了GPU。

你再看看整個行業,有不少公司在做AI芯片,但也有不少項目被砍掉了,比如Dojo最近就被取消了。

造芯片真的很難。

如果一個公司說「我要造自己的AI芯片,來跟英偉達競爭」,這就像有人說:「嘿,谷歌搜索挺好的,我們來複制一個吧。」——這完全是瘋了!

因爲那種級別的芯片優化、設計、工程實現,難度太高了。你要複製它,成功的概率極低。

當然,如果市面上有很多人在嘗試,而你有選擇權,那隻要其中有一個成功了,你就多了一顆芯片可選。

哈里 我們剛才也提到,爲了保住「七巨頭」的位置,你必須不斷投入。比如英偉達投1000億美元進OpenAI,OpenAI再拿這筆錢回頭去買英偉達的芯片。這是不是就是個無限循環的資金遊戲?

喬納森 如果他們只是把錢繞一圈回給自己,那當然是。但問題是,這筆錢其實是拿去給供應商建芯片的,所以它不是一個資金空轉。

換個角度想:這筆投入裏,大約有多少比例是真正流向了芯片基礎設施建設?40%。所以至少有40%的資金是進了整個供應鏈生態系統的。

這就不能算是一個無限循環。

哈里 那就是個「部分循環」?60%回到英偉達,40%流出去?英偉達確實拿回了60%,而他們的股價也因此漲了幾千億美元。你怎麼看待這種結構?

喬納森 那我們可以從不同角度來看它。

從經濟學角度講,這完全說得通。只要能帶來(客戶)鎖定效應,那你當然願意這麼幹。

爲什麼營收的增長能推動市值漲得比營收本身還多?就是因爲市場相信這種增長是可持續的。

我覺得對英偉達來說,這個邏輯成立。但不只是因爲英偉達厲害,雖然它確實非常強,還因爲全世界的算力總量根本不夠用。

真的,現在算力的需求是瘋狂的、無法滿足的。

我敢說,如果今天給OpenAI和Anthropic的推理算力都翻一倍,那麼從現在起一個月內,他們的收入幾乎就能翻倍。

哈里 等等,你能幫我拆解一下這句話嗎?你是說他們因爲算力受限,所以現在的營收被卡住了?但如果給他們雙倍算力,爲什麼收入也能雙倍?

喬納森 現在,大家對Anthropic最大的抱怨之一就是限流太嚴重。用戶根本拿不到足夠token。如果他們有更多的算力,就可以生成更多token,進而收費更多。

而OpenAI提供的是聊天服務,那你怎麼控制聊天服務的流量?辦法就是讓它變慢,結果就是用戶互動減少。

哈里 你覺得速度到底有多重要?畢竟也有很多人認爲:其實延遲也沒關係,我完全可以接受有延遲。我輸完prompt後,可以去幹點別的,等它慢慢跑出結果。

喬納森 嗯,這種觀點吧……挺有意思的。

但我們可以看一個類比,比如CPG(快消品行業)。

我們來按照利潤率,把快消品排個序:利潤率最高的是捲菸,其次是嚼煙,再往下是碳酸飲料,再往下是瓶裝水之類的。

那什麼因素和高利潤率最強相關?就是產品成分對你的作用速度。

也就是說,那種激活多巴胺的循環,越快生效,你對品牌的黏性就越強。

你越快感受到反饋,就越容易對那個品牌產生情感連接,也就越容易建立品牌價值。

這也是爲什麼谷歌如此強調速度,爲什麼Facebook不斷優化響應速度。每提升100毫秒的加載速度,轉化率就能提升約8%。

所以,那種「沒關係,prompt可以在後台慢慢跑、用戶等一等也行」的想法,完全是錯的。百分之百錯誤。

當我們剛開始爲芯片提升速度時,我們其實就知道自己能做到多快。我們甚至做了一個演示視頻,展示了芯片的實際速度。

但很多人看完視頻會說:「爲啥還要比人類閱讀速度更快?看得懂就行吧。」

我通常就反問他們:「那網頁加載爲什麼要快於閱讀速度呢?」

這裏有一個認知斷層,很多人無法真正理解「速度」在人類體驗中的本能重要性。

人類其實很難判斷哪些因素真的影響參與度和最終結果,但我們從早期互聯網公司的經驗裏,早就明白了這一點。

自主研發芯片的核心動機

哈里 你覺得OpenAI最終會自研芯片嗎?我想英偉達肯定會擔心OpenAI也想搞垂直整合,把芯片環節也收入囊中。你覺得他們能成功嗎?

喬納森 我覺得做芯片有個誤區:很多人以爲最難的是把芯片造出來。但真正做下去之後,你會發現:最難的是軟件。

然後你繼續做,就會意識到:真正最難的是跟得上行業的演進。

我毫不懷疑OpenAI會自己做芯片,Anthropic也一樣。未來每一家科技巨頭都會自研芯片。

我記得在谷歌的時候,有一次參觀實驗室,那會兒AMD還不算太強(當然現在他們做得很好)。

我們當時部署了1萬台服務器,全是用AMD芯片。

我走過實驗室,看到他們把服務器從機架上拔下來,把AMD芯片拆掉,直接扔進垃圾桶。

哈里 真的假的……

喬納森 真的。而且你可以說這是命中註定,因爲當時所有人都知道,那一代芯片裏英特爾會贏。

那谷歌爲啥還要做1萬台AMD服務器?很簡單,他們是爲了在採購英特爾芯片時拿到更好的價格。

當你是這種量級的玩家時,你會發現,爲AMD設計自己的主板、搭建測試平台、部署生產……所付出的成本,完全值得換來英特爾的採購折扣。

所以當公司決定自己做芯片時,動機不一定是要量產部署,很多時候是出於博弈和議價策略。

還有個更少人知道的事實:英偉達現在在HBM(高帶寬內存)上幾乎處於買方壟斷地位。

所謂買方壟斷是壟斷的反面——不是隻有一個賣家,而是隻有一個買家。

現在GPU裏的HBM供應是有限的。GPU本身是用跟手機芯片一樣的工藝製造的,所以如果英偉達願意,他們每年可以生產5000萬顆GPU核心。

但現實是,今年他們大概只會造出550萬塊GPU,原因就是HBM和中介層的產能限制。

於是情況就變成了這樣:一家科技巨頭走過來說:「我想要一百萬顆GPU。」

英偉達回應:「不好意思,我還有其他客戶。」

然後這家科技巨頭反擊說:「沒問題,我自己造。」

然後你會發現,突然間英偉達就生產出一批GPU,優先給了這家公司。

現實是,整個市場的產能就是有限的。你自己造芯片,其實真正獲得的並不是一顆「屬於你自己的芯片」,而是對自身命運的掌控權。

這才是自研芯片最核心的賣點。

哈里 掌控自己的命運,意味着什麼?

喬納森 意味着英偉達不能再告訴你:「你這季度只能拿到多少塊GPU。」你當然可能要付出更高的成本,因爲自研芯片未必有英偉達的好。

我們再想想看,爲什麼英偉達的GPU能憑藉比AMD稍微好一點的性能就徹底統治市場?

如果你部署整個系統的總成本是芯片本身價格的很多倍,那芯片哪怕只貴一點點,影響其實可以忽略。

舉個例子:假設我要部署一臺系統,芯片在整機BOM(物料清單)裏只佔20%,那即使芯片貴了20%,對整個系統的總成本影響也很小;但如果這顆芯片的性能提升了20%,那整臺機器的價值就提升了20%。

所以你就會發現,只要芯片性能哪怕略有優勢,整機的價值就大幅提升。哪怕是小幅性能差異,也會帶來巨大的銷售優勢。

HBM供給瓶頸與數據中心攤銷

哈里 你剛才提到了買方壟斷。那在這種情況下,OpenAI、Anthropic,或者「七巨頭」裏的其他公司,還有可能真正進入芯片層嗎?

喬納森 如果HBM市場是買方壟斷,那確實很難。但從HBM的供應商角度,他們還是有動力把資源分散給更多客戶的。

英偉達因爲採購量巨大,議價能力特別強,可以壓低價格。假如你是HBM生產商,正在規劃新的封裝廠、整套供應鏈,那當英偉達帶着大支票走進來,你當然優先服務他們。

所以,英偉達總能提前拿到他們想要的那部分產能。問題是,這張支票你必須提前兩年以上開出來。

如今AI市場已經進入爆發式增長階段,就算是英偉達、賬上有充足現金,也很難提前兩年把未來所有的需求都算清楚、簽好單。

因此供給瓶頸是必然的。這不僅是因爲市場結構偏向買方,更因爲資本支出巨大,而HBM廠商普遍又很保守。

還有一點:HBM的利潤率實在太高,高到讓廠商根本不願擴產,因爲一旦產能增加,價格就會下滑。

哈里 完全明白了。但我想問,當我們看到OpenAI和Anthropic都在做自研芯片,這是不是也解釋了他們爲什麼要融資?

比如薩姆(薩姆·奧特曼,Sam Altman)說他們未來可能需要幾千億美元,是不是這些都已經考慮進去了?

喬納森 其實不是。真正燒錢,不是買芯片系統,而是建數據中心。

數據中心的成本更高,關鍵在於它的攤銷週期更長。哪怕它只佔你年度成本的三分之一,但如果芯片攤銷期是三到五年,數據中心則可能拉到十年。從年化角度看,它反而更貴。

所以你看到那些科技巨頭每年投750到1000億美元,其實是在爲未來十年甚至更長時間做準備,擴建數據中心產能。

這樣看,這個數字也就不那麼誇張了。

哈里 但如果芯片更新週期比三到五年還快,那我們現在用的攤銷模型是不是也已經失效了?

喬納森 沒錯。很多公司確實設定了過於樂觀的攤銷週期。

我們自己內部是按更保守的方式來計算的:五到六年是上限,很多時候我們更願意按三年來算。

我們基本是按照「一年一代芯片」的節奏在規劃。

你應該這樣理解芯片的價值,它有兩個階段:一個是值不值得部署;另一個是值不值得持續運行。這其實是兩套完全不同的經濟模型。

部署的時候,你需要確保回收資本開支並有投資回報;但一旦部署完,只要這顆芯片跑出來的價值能覆蓋電費和託管費,它就值得繼續跑。

所以你可以接受芯片賬面價值隨時間遞減,只要它還跑得動。

眼下大家在賭的一件事就是:下一代芯片出來之後,舊芯片的價值會不會低到連運營成本都覆蓋不了。

在我看來,所謂「五年攤銷」這個假設其實不太現實。因爲到了第五年,新芯片性能已經大幅領先,舊芯片跑出來的價值可能已經撐不起它的電費和數據中心租金。

哈里 那到時候怎麼辦?會不會積壓一堆跑不動的廢芯片?

喬納森 不一定。因爲很多公司都簽了長期合同,毀約成本也是一個要考慮的變量。有時候,「虧本運行」可能比「付毀約金」更划算。

哈里 我明白了。但真到了那一步,該怎麼辦?

喬納森 那我也沒法告訴你,因爲我們正在盡全力避免出現那種情況。

所以我們在所有的模型裏都在追求更快的投資回收期。我自己絕不會去賭一個太長週期的投資。你的下注週期越短,你的結果就越清晰可控。

更多算力就能得到更好的產品

哈里 所以本質上就是,儘可能縮短回本週期,同時儘可能降低運營成本,這樣才能更快淘汰性能差的芯片?

喬納森 沒錯。不過還有一個挺瘋狂的點你可能沒想到。

如果你用會計師的視角來算賬,這套模型確實挺糟糕的,看起來根本不值得幹。

但實證觀察告訴我,人們現在還在租用H100芯片。這些芯片問世快五年了,但仍然運行得很好,而且賺的錢遠遠高於運行它的成本。你不會在今天部署一塊新的H100,你會繼續讓它運行,因爲它仍然有利可圖。

哈里 它已經從部署階段進入了維持階段。

喬納森 對。根本原因是,大家還是拿不到足夠的算力。

如果不是這樣,H100的租金早就跌成白菜價了。但只要算力供不應求,這種狀況就會一直持續。

問題是:有沒有什麼替代方案,不那麼受限於供給?

這就是我們希望能切入的地方。

我們再回到你剛開始問的「速度」問題。你知道有多少客戶一開始找我們,是因爲追求速度嗎?

哈里 多少?

喬納森 全部都是。但你知道他們中有多少人在了解了「市場供給現狀」之後還繼續問速度嗎?

哈里 有嗎?

喬納森 一個都沒有。

一開始大家都說:「我很在意速度,我知道這對終端客戶意味着什麼。」但接着他們就意識到:「等等,我連算力都買不到。」

所以真正的價值主張就變成了:你能不能提供足夠的算力容量?

就在兩週前,有個客戶來找我們,說他們要5倍於現有系統的算力。他們找遍了所有超大規模雲計算公司,一個都無法滿足。我們也給不了,沒有任何人能滿足。因爲整個市場就沒有足夠的算力。

所以你面對的選擇是,我有這份算力,就能拿下這個客戶。這就是你之前說的,如果OpenAI或Anthropic拿到雙倍算力,就能拿到雙倍收入。

如果你是一家連服務客戶所需算力都不夠的公司,那你一定願意不惜一切代價去爭取這個客戶。因爲你相信:先拿下客戶,就能建立長期的鎖定價值。

我們最大的賣點之一是:我們的供應鏈跟GPU的完全不一樣。

你要訂GPU,要提前兩年寫支票;但你要訂我們系統,只需給我們打張一百萬LPU(Groq 的推理芯片)訂單的支票,六個月後就能開始交付。

哈里 六個月?這可比GPU快一年半!

喬納森 沒錯,差距就是18個月。

我之前和某家超大規模雲計算公司的基礎設施主管開會。我談了性能、成本什麼的,他都還算平靜。

但當我提到我們六個月交付能力時,他直接打斷我,開始認真追問那件事。他唯一關心的,就是供應鏈。

哈里 換個角度想,現在模型迭代速度這麼快,你覺得「兩年交付週期」還有意義嗎?

喬納森 你聽說過莎拉·胡克(Sara Hooker)嗎?

哈里 沒有。

喬納森 她寫過一篇論文,叫《硬件彩票》(The Hardware Lottery)。我用一句話概括那篇論文的核心意思就是:人們是在爲硬件去設計模型。

所以理論上可能存在一些架構比attention更好,但attention在GPU上跑得特別好。

這就帶來一個結果:如果你是現有的主導者,你天然佔優勢,因爲大家都會圍繞你的硬件來做模型設計。哪怕外面真有更好的架構,只要它在你的硬件上跑不起來,那它就不算更優。

這裏面會形成一種小循環。

所以如果你是既有玩家,你按「兩年之後」的節奏去規劃,問題不大。但如果你是想進入市場的新玩家,沒有人會提前兩年就爲你的芯片做適配。

你必須把迭代週期做得更快。

哈里 你剛才也提到OpenAI會做自己的芯片,Anthropic也是。那在這樣的世界裏,英偉達怎麼辦?客戶還那麼集中……

喬納森 確實。沒有人真正能預測AI的發展速度。

我們最開始不是就在討論AI是不是泡沫嗎?你看看過去十年數據中心基礎設施的建設節奏,你得提前兩、三、四甚至五年去規劃,結果呢?

所有人的預測幾乎都錯了。大家總是建得太少。

這已經成了過去十年的規律。所以當你十年都建不夠之後,你就會說:「那我這次要建多一點,要建超過我最樂觀的預期。」然後,又捉襟見肘了。

於是你再次上調預期,又建,又不夠……週而復始。

這就是現實。而且,大多數人還沒有意識到的關鍵點是:AI並不是像SaaS(軟件即服務)那樣運作的。

在SaaS模式下,你有一批工程師構建產品,產品好不好,取決於他們怎麼寫的代碼。

但AI不是。在AI模型裏,我可以通過多跑幾遍prompt來挑選更好的答案,直接提升產品質量。

我還可以爲每一個prompt多花點錢,讓模型跑得更好。我甚至可以根據用戶的價值決定——這個客戶重要,我就給他更高質量的結果。

OpenAI前幾天就公開了一個類似的策略:他們會推出一些產品,這些產品的運行成本非常高,所以只會開放給少數用戶,同時價格也會更高。他們想看看,當模型獲得更多算力後,產品能變得多好。

這,就是未來方向。

只要你爲應用分配更多算力,產品質量就會上升。這就是爲什麼你會發現,很多AI公司「token-as-a-service」支出幾乎等於收入。因爲他們花得越多,產品就越好,客戶就越多。

美國模型優勢來自於壓倒性的算力優勢

哈里 完全理解這一點。但我想直白一點問你:我們看到GPT-5在追求效率,有很多人說薩姆已經從「性能優先」轉向了「效率優先」,因爲算力投入並不會線性帶來性能回報。

你覺得這個說法對嗎?會不會和你剛才講的觀點相矛盾?

喬納森 我不覺得矛盾。你要分清楚他們追求的結果不同。

比如OpenAI現在進入的是一些極度敏感的價格市場,就拿印度舉例來說吧,如果你想在印度贏得市場,有一個核心指標是什麼?

每月訂閱費必須控制在99盧比左右,大概是1.13美元。你必須把服務控制在每月一美元出頭的價格,才能服務那些「否則就用不了AI」的用戶。

哈里 那印度用戶也可以選DeepSeek這種?

喬納森 這正是市場上的另一個誤解。我們可以來拆幾個誤區。

哈里 好啊,我喜歡拆誤區。

喬納森 比如中國的一些開源模型發佈時,大家的第一反應是:「天哪,他們訓練出了幾乎和美國一樣好的模型!」

我們當時還專門聊過這事,錄了一期播客。說實話,我一開始也有點被帶節奏了。但很多人沒看到的是:這些模型真的更便宜嗎?它們真的更適合實際部署嗎?

現在我對主流基礎模型和中國模型了解更多以後,我可以肯定地說:中國的模型運行成本並不低,實際上要貴大概10倍。

我們就拿最近發佈的OpenAI的GPT-OSS模型來說吧。它優化的目標跟中國模型不一樣,但質量非常高。我甚至會認爲:就它所專注的那個方向而言,它顯然比中國模型更好。當然,中國模型也各自有不同側重點。

但關鍵是,跑這個OSS模型的成本,大概只有中國模型的十分之一。

那爲什麼當時大家會覺得中國模型更便宜?其實是被價格誤導了。很多時候,一個模型一旦成了「市場唯一選項」,大家都指定要用它,而提供方也只有一個,那它自然可以把價格抬上去。價格高了,大家就誤以爲成本也高。

實際上,中國模型的優化重點是在訓練階段更省錢,而不是推理階段更高效。但如果你把OSS模型和中國模型在推理環節的效率拉出來對比,就會發現一個很明顯的事實:美國在訓練上的強度和密度,依然遠遠領先。

這在經濟上也說得通。訓練一個模型花出去的錢,最後是要靠每一次推理(inference)去「攤平」的。那怎麼攤得快?就得讓每次推理便宜。

怎麼做到這一點?那你在訓練階段就得花更多資源,把模型壓得更緊湊、更高效。

而這一點上,美國的優勢特別明顯——我們擁有壓倒性的算力優勢。我們可以用更強的計算資源把模型訓練得更徹底,最終換來的是:推理更快、成本更低。

哈里 我們爲什麼能有這樣的算力優勢?就因爲我們能拿到芯片嗎?

喬納森 對,就這麼簡單。

哈里 那中國就不能靠補貼,把推理這部分「燒錢頂住」?我理解他們現在確實在補貼啊。雖然運行成本高一點,但靠砸錢也能扛下來吧?

喬納森 這就要分清「主場」和「客場」的區別了。

所謂主場,指的是我們自己,爲美國本土建設足夠的算力;客場,則是一些盟友,比如歐洲、韓國、日本、印度等等——我們希望也爲他們提供算力支持。

在主場,中國當然可以下重注。他們計劃建150座核電站,雖然芯片能效沒那麼高,但電力夠多,再加上政府補貼,確實能把運行成本壓下來。

但到客場,局面就不一樣了。你想,一個國家如果只有100兆瓦電力,能輕易說建就建一個核電站嗎?顯然不行。這是中國能做、但別的國家沒法做的事。

所以,誰能提供更節能的芯片,誰就能在客場取得壓倒性優勢。

我的判斷是:未來兩到三年,美國在AI的客場戰役上,會明顯領先中國。

如果我們動作夠快,就能帶上一批盟友共同進入AI競賽的正軌。

哈里 那你覺得我們應該開源模型嗎?畢竟中國在模型這方面的能力已經很強了。

喬納森 我覺得模型本身不一定是決定性的優勢。

你還記得你第一次請我上節目的時候嗎?我當時就預測,OpenAI會開源他們的模型。

哈里 記得,你當時確實這麼說了。

喬納森 我之所以這麼判斷,其實主要是基於OpenAI的品牌力。

說句實話,就算他們只是拿兩年前Meta發佈的LLaMA 2模型,貼上自己的牌子,很多人還是會用。這就是品牌的影響力。

當然,他們現在的模型本身也確實非常強,但就算哪天性能不領先了,大家還是願意用他們的模型。

我認爲,Anthropic應該開源自己上一代的模型,目的不是爲了比拼SOTA,而是給用戶一個替代中國模型的選項。

因爲那些願意用中國模型的人,至少也可以選擇用Anthropic的開源模型。這會帶來幾個好處:

第一,prompt是可以複用的,就像軟件之間的兼容性一樣;

第二,用戶一開始用了Anthropic的模型,後面要轉向他們的商業模型,遷移成本就很低。而用中國模型,往往prompt結構都不一樣,沒法兼容,切換難度更大。

就像當OpenAI發佈OSS模型時,很多人開始採用它,原因之一就是,原來寫的prompt可以直接用,不用重寫。

當然,如果你是低成本應用,暫時還承擔不起OpenAI的付費模型,那你可能會從開源模型開始。但只要你業務做起來、有了收入,自然就想上更好的模型。

這時候,prompt的兼容性就成了巨大的優勢。

除此之外,開源模型還有一個附加好處:它能帶動整個基礎設施生態圍繞它優化,把運行成本進一步壓低。

這種生態層面的正反饋,會催生大量創新。

沒有能源,就沒有算力

哈里 我們剛才聊到的主題是:要儘可能建設更多的算力。但你也知道,這對能源的需求是巨大的。那我想請教一個直接的問題:支撐這場算力浪潮或者說是算力海嘯,唯一可行的能源解決方案,是不是核能?

喬納森 不是。核能確實高效、成本也合適;但可再生能源同樣高效,也能控制成本。

我給你一個很簡單的思路:只要美國的盟友願意把算力部署在能源便宜的地方,他們其實可以獲得比中國更多的能源資源。

我們就以美國和歐洲作比較:美國整體上,其實是個更「怕犯錯」的國家。

哈里 你說的「怕犯錯」,是指在能源領域嗎?還是泛指?

喬納森 泛指,美國在很多事情上都更謹慎。

但我們要區分兩種「犯錯」方式:一種是做錯事;另一種是錯過機會。

美國特別害怕「錯過機會」。在一個高速增長的行業裏,「沒做」造成的損失,往往比「做錯」還嚴重。

而歐洲則相反,他們更傾向於接受「錯過」的風險。

你看他們現在參與AI競賽的方式,是通過立法來設定邊界,比如要求「數據必須存在本國」、「必須留在歐洲」等等。

但其實,如果歐洲真想參與這場AI競賽,只需要做一件事:讓挪威全力發展風能。

爲什麼是挪威?因爲他們的風電可用率接近80%。也就是說,一年裏有80%的時間都在穩定發電。

再加上他們已經有龐大的水電基礎,如果他們把風電規模擴大到現有水電的5倍,光是挪威一個國家,就能發出相當於整個美國的電力,而且是穩定、綠色的。

哈里 你的意思是……挪威一個國家,就能撐起整個美國的用電需求?

喬納森 對,完全可以。

這也說明我們還浪費了多少潛在的、非核能的清潔能源資源。當然,我也支持發展核能。現代核電技術已經非常安全。

哈里 那我們爲什麼不大規模上核能?就只是因爲大家害怕嗎?

喬納森 基本就是出於恐懼。

哈里 那你和歐洲政府聊這些能源話題時,他們是怎麼回應的?

喬納森 我一般不會主動談核能。因爲這是一個一開口就會被廣泛反對的議題,我不想一開始就引發政治阻力。

但我最近在日本,他們正在認真討論重啓核電。外界常覺得日本做事慢,其實這是因爲不了解細節。日本確實在「決策階段」很慢,但一旦做出決策,執行非常快。

比如他們決定要建一座2納米晶圓廠,我上次去時,他們已經開始展示他們做出來的2納米晶圓了。

當然,目前良率還不夠量產,但廠房已經建成,產品也做出來了,只差繼續提升良率。

他們還承諾將投入650億美元發展AI,行動非常迅速。

而且他們也會重啓核電。

哈里 哇,如果連日本都重啓核能,那歐洲可真的該緊張了。

喬納森 沒錯,他們現在得開始追趕了,對吧?

哈里 不過我剛才一直在想你說的「挪威風能」。問題是,想建出那麼多風電設備,起碼也得幾年時間吧?你覺得挪威政府真會出錢,在海岸線上造一萬個風機?

喬納森 那爲什麼一定要是挪威政府出錢呢?

哈里 那還能誰出?

喬納森 比如科技巨頭們可以出;或者那些希望在歐洲部署AI的國家,也完全可以出。

你看看沙特,他們有大量千兆瓦級別的備用電力資源,還正在圍繞這些電力建設新一代數據中心。

那歐洲爲什麼不和沙特合作?

沙特現在正在推進一個計劃,叫「數據大使館(data embassies)」:數據依然屬於原主權國家,但可以利用沙特的能源運行。爲什麼不合作呢?這樣問題就能解決。

我預計他們很快就會建成3到4吉瓦的發電能力。

所以未來很可能的路徑是:科技巨頭出資,租用挪威或沙特的清潔能源,再基於這些能源部署大規模算力。

哈里 但這些巨頭總是在抱怨,說行政審批太慢、流程太複雜。

喬納森 我之前和一個大型能源公司的董事聊過,他們是建核電站的。他說在美國,用於審批流程的費用是核電站本身建設成本的三倍。

我不清楚歐洲的情況,但通常來說,美國在這方面還比歐洲快一點。

哈里 在歐洲建一座核電站,到底花錢最多的,是工程本身,還是冗長的審批流程?

喬納森 我覺得大家真正要記住的是這句話:誰掌握算力,誰就掌握AI;而沒有能源,就沒有算力。

哈里 那我們再回到歐洲本身——你怎麼看現在的局勢?歐洲到底落後多少?還有追趕的希望嗎?我不是想唱衰,但我們真的還有機會翻盤嗎?

喬納森 我不覺得歐洲已經錯失良機。只要現在開始行動,一切還來得及。

中國確實在執行效率上更快一些,但別忘了:歐洲有5億人口,美國有3億多,再加上所有盟友,比如韓國,他們有建核電站的成熟經驗,阿聯酋的核電站就是韓國承建的。

所以我們爲什麼不能搞一個「能源版的曼哈頓計劃」呢?

我今年夏天走了很多歐洲國家,夏天熱得驚人,冬天又冷得刺骨。

這種極端的氣候體驗,幾乎全球其他地區都沒有。那爲什麼不借此機會加速能源基礎設施建設?

哈里 我非常同意你的判斷。但現實是,無論是單一政府,還是跨國協調,政策落地的速度永遠趕不上AI的發展。

如果我們無法以匹配AI的速度推進能源計劃,會發生什麼?

喬納森 那歐洲未來的經濟結構,可能就會退化成「觀光經濟」,人們來看看老建築、拍拍照,僅此而已。

如果你沒有支撐新一代經濟所需的基礎資源,就註定無法參與未來。

而這個未來,就是建立在算力基礎上的AI經濟。

哈里 那「模型主權」夠不夠?比如歐洲自己訓練模型,是否就能掌握主動權?

喬納森 遠遠不夠。如果你沒有足夠的算力,模型根本跑不起來。性能再好也沒用。

你就算訓練出一個比OpenAI強10倍的模型,但只要OpenAI有你10倍的算力,他們在真實世界的表現就一定更好。

哈里 但像Misra這樣的公司不是正在推進「歐洲模型主權」嗎?他們說:「德國醫保系統、克羅地亞交通部用的是我們的模型,因爲我們不是美國公司。」

喬納森 這其實不構成真正的護城河。你得問:它的獨特價值是什麼?

「我們是歐洲公司,不受美國管轄」——這聽上去挺有說服力,尤其在某些政治場合。但這跟「你有沒有足夠算力」沒有任何關係。

它解決的是「別人不能控制我」,但沒解決「我有沒有能力幹成事」。

當然,我不是在否定Misra,我們也跟他們有合作,我個人也很欣賞他們。

我想強調的是:你得有基礎設施,才有真正競爭力。沒有足夠的算力,任何模型都只是空談。

算力是AI供應鏈中,最可預測、最確定的環節

哈里 聽你說到這,我都想立刻去買CoreWeave的股票了(笑)。他們現在做的按需算力聽起來簡直太理想了。

喬納森 CoreWeave確實是非常優秀的公司,但他們的GPU配額也很緊張。現在每家都有配額問題。

哈里 你之前跟我說過,其實GPU也不是最理想的推理基礎設施,對嗎?

喬納森 對。隨着訓練逐漸趨於成熟,AI正在步入一個「推理爲主導」的階段。

哈里 那是不是意味着英偉達的主導地位會被削弱?

喬納森 不會。英偉達會賣掉它能生產出的每一塊GPU。

就算我們最終部署的LPU數量是GPU的十倍,也只會讓市場對GPU的需求更強,英偉達還能賣得更貴。

哈里 這聽起來有點反直覺,爲什麼會這樣?

喬納森 因爲你部署得越多,就需要訓練得越充分來支撐推理效果;你訓練得越多,又要部署更多推理能力來攤薄訓練成本。

兩者是正向循環。

哈里 那你覺得現在推理市場的發展,是否符合你當初的預測?比如成熟度、部署速度?

喬納森 完全出乎我預料的一點是,AI居然是基於語言的。

這使得人們可以用最簡單的方式與AI交互。我原本以爲它會像AlphaGo那樣,是種很怪異的智能系統。

結果它是語言。意味着任何人都能用它。

我當初的預測是:AI會更早出現,但增速會很慢。但實際情況是:AI來得晚一點,但增速遠超我的預期。

它的交互門檻實在太低了,現在全球差不多有10%的人每週在用ChatGPT。這太驚人了。

哈里 確實。那你知道目前限制它進一步普及的主要障礙是什麼嗎?

喬納森 是算力。

算力限制了AI的質量。但更現實的問題是:就算質量沒那麼完美,只要能支持更多語言,就會有更多人願意使用。

哈里 這也是我們在全球市場上聽到最多的用戶抱怨之一。

喬納森 那怎麼解決?就兩個字:堆算力。

你有更多算力,就能處理更多數據;你有更多數據,就能訓練得更充分。

甚至你可以生成合成數據(synthetic data),這也是推動訓練的重要資源。

AI的三大核心要素:數據、算法、算力。這三者只要有任何一個提升,整體能力就會上升。

它們之間沒有「硬瓶頸」,不是說你算法不變,就不能多用數據;也不是說數據不變,就沒法多上算力。只要有一個進步,AI就能變強。

也正因如此,AI的發展路徑其實並不複雜。只要你在某一維度持續投入,整體就會推進。

而在這三者中,最容易提升的,就是算力。

算法進步緩慢;優質數據難以收集,合成數據仍有不確定性。

但算力不同。你只需要開出一張足夠大的支票,等上一段時間,你就能拿到更多。

算力是AI供應鏈中,最可預測、最確定的那個環節。

哈里 但就算我們已經意識到算力的重要性,其實大家還是大大低估了真正所需的規模,對嗎?

喬納森 完全正確,低估得非常嚴重。

哈里 你覺得這種低估有多誇張?

喬納森 還是那句話:每次你給模型增加算力,它的表現都會變好。這意味着,我們對所需算力的低估,是沒有上限的。

這和工業革命是兩回事。

在工業時代,光有能源還不夠,你還得製造機器,而造機器是需要時間的。比如你想讓街上多跑點車,不是把石油抽出來就夠了——你還得先把車造出來。

但AI不一樣。

雖然你也可以通過算法優化,提升效率,但最直接的辦法就是堆算力。你把算力翻倍,就能支持更多用戶,提升模型質量,拓展AI應用的邊界。

我們從沒遇到過這種情況,不是瓶頸問題,而是一個「加一塊就變更好」的系統。每多塞進去一點算力,AI整體表現就上一個臺階。

未來會出現一個「勞動力荒」

哈里 你之前提到AI能增強經濟體,這是不是建立在一個假設上:就是未來全球GDP中,用於人力的10萬億美元支出,會有一部分逐漸轉向AI?你覺得在接下來的五年,這種結構性轉移真的會發生嗎?

喬納森 我認爲未來會出現一個「勞動力荒」。不是AI搶走大家的工作,而是我們的人手不夠,去填AI帶來的新崗位。

接下來會有三個變化:第一,是強烈的通縮壓力。你這杯咖啡、你的房租,幾乎所有東西都在變便宜。

哈里 等等,爲什麼連咖啡也會更便宜?

喬納森 因爲AI和自動化會全面提升效率:咖啡種植會交給機器人;供應鏈調度由AI管理;連咖啡本身都能用基因工程優化,讓產量更高。

從種植到運輸再到銷售,每一個環節都變得更高效,成本自然下降。

所以我們將迎來一輪系統性的通縮,生活成本降低,維持生活的支出變少。

第二,人們會逐步退出勞動力市場。

大家會選擇少工作、甚至提前退休。因爲生活成本更低了,工作動機自然下降。

第三,是全新的崗位和產業將被創造出來。

你想想一百年前,美國98%的人都在幹農活。等到農業只剩2%的勞動力時,剩下那98%的人幹什麼去了?他們並沒有失業,而是進入了那些當年根本不存在的新行業。

未來也一樣:「軟件工程師」這個職業,100年前沒人聽過;「網紅」這種崗位,以前根本沒人能理解。將來我們也許會看到「直覺編程(vibe coding)」成爲新的基本技能,人人都會一點。

所以結論是這樣的:通縮壓低生活成本;大量人選擇減少工作甚至退出工作;與此同時,全新崗位與公司大量湧現,反而人手不夠。

哈里 這真是完全反主流敘事。現在大家都在擔心AI會讓幾百萬人失業,而你反過來說:我們反而缺人來填新崗位。

喬納森 沒錯,這就像過去人們曾擔心全球會大規模饑荒,結果我們生產力提高了,人類反而過剩。

人們總是低估技術變革對經濟結構的影響。

哈里 說到變革,你怎麼看特朗普及其團隊對美國AI發展的影響?是加速器還是障礙?

喬納森 整體上是加速器。他們在一些制度層面確實做了簡化,比如審批流程。從政策角度看,他們對AI的態度是積極的。

哈里 你剛剛提vibe coding,我得追問一下。你覺得這會成爲一個長期趨勢嗎?很多人覺得這類新工具只是過渡產品,你怎麼看?

喬納森 我覺得vibe coding的發展路徑就像讀寫能力。

早年只有一小部分人識字,識字的人就能當抄寫員,這是個技能型職業,待遇也很好。

編程現在也是同樣的處境。

但將來,每個人都會讀寫代碼,不是爲了當程序員,而是因爲這變成了所有行業的基本能力。

做市場的人需要寫自動化腳本;做客服的人也可能需要處理系統邏輯。

我有個朋友開了25家咖啡店,從沒寫過一行代碼。他用vibe coding做了一個簡單的庫存系統,能看每家店的存貨情況。

一行代碼沒寫,全是靠自然語言生成的。

後來他開始遇到各種小bug,「這個按鈕點不了」、「那個頁面卡住了」……完全是我們工程師日常處理的場景。

他也開始自己修這些問題,用的還是vibe coding。

這才是真正的趨勢:人人會一點點寫代碼,它像讀寫能力一樣融入生活。

爲何力求保持低利潤率

哈里 在這樣一個指數級增長的世界裏,我想問個現實問題,保持低利潤的策略有意義嗎?比如你們自己開發的AI平台,毛利其實並不高。那低利潤是不是一種劣勢?

喬納森 我是這麼來看的:利潤的真正意義,是給你抗波動的緩衝墊。

如果你利潤率很低,一遇到融資困難或市場波動,你就可能扛不住。下一輪錢可能融不到;銀行可能不願意放貸。

但有利潤,你就有實力留在牌桌上。

當然,利潤高也意味着容易引來競爭者。有句老話說得好:「你的利潤,就是我的機會。」

所以這始終是一種權衡:你要在「穩定性」和「護城河」之間做選擇。

哈里 那你們公司內部是怎麼思考利潤空間的?

喬納森 我認爲公司必須有利潤空間,但這份空間,應該優先回饋給客戶。

你得有靈活性,能讓也能收。這樣在市場上你才會處於有利位置。

我曾經面試一位CFO候選人,雖然最終我們請的是另一位,但那位候選人說了一句很有意思的話:我們可以用提價來降低需求。

哈里 聽上去挺合理,從經濟學角度也說得通。

喬納森 對,邏輯上講得通。

但我反問:那我們是不是也可以濫用品牌信任?是不是也可以用客戶對我們的信任,去賣他們並不需要的東西?

品牌價值是有價值的。你應該讓品牌信任度維持在儘可能高的水平。

因爲信任是有複利效應的。

同樣的道理,我認爲利潤率也應該低到一個水平,讓客戶覺得你始終在給他們一個好價格。如果你賺得太狠,你就是在和客戶對立。

我希望我們的利潤率是在不影響公司穩定運營的前提下,儘可能低的。

我的現金流來自哪裏?來自銷量的增加。而我喜歡算力這個生意的原因是:算力的需求是無止境的。

這就是Jevons悖論(這個悖論由英國經濟學家威廉·斯坦利·傑文斯在1865年提出。他觀察到:隨着蒸汽機效率的提升,單位煤炭可以做更多的工作,人們預期煤炭使用會減少,但實際上,煤炭的總消費量反而增加了。):你每多生產10倍的算力,就能賣出10倍的量。

只要我們持續降低成本,用戶就會買更多。

所以我的目標是持續壓低成本、提升銷售量、讓用戶以更低的價格獲取更多價值,從而繼續買更多。這個飛輪會一直轉下去。

哈里 那我們現在這個成本壓降的過程走到哪一步了?

我還記得我們早期節目的時候,我會問一些問題,現在回頭看真有點想笑,比如我會擔心Canva推AI後利潤率會不會被拖低?結果現在一看,AI實施成本已經下降了98%!

你覺得我們這輪成本下降的週期,現在處在哪個階段?

喬納森 我們先往後退一步,還是用你剛才說的Canva做例子。

真正成功的公司,不是盯着利潤表看,而是盯着客戶。他們在做的,是解決客戶遇到的問題。

如果你總是在比價格,那你就輸定了。你真正該做的是差異化,去解決客戶還沒能解決、其他人也解決不了的問題。

客戶很樂意爲此付費。

如果你只看利潤表,好像這筆AI開支不合理;但如果客戶通過這項AI服務解決了一個本來解決不了的問題,那就完全合理。

而且通常來說,AI還能帶來一個額外好處,即擴大市場規模。比如你兩年前用Photoshop,很難用;現在你只需要給個prompt,就能生成圖片。

門檻降低了,市場規模自然擴大。你可能單張圖片收的費用更低了,但總收入反而提升了,因爲你服務了更多人。

AI領域的人才大戰進入史上最瘋狂

哈里 讓我問個金融問題。現在標普500都快要衝到7000點了,「美股七巨頭」一路狂飆,我們已經很久沒見過這麼集中、這麼結構性的上漲行情。可聽你講AI,又感覺這才只是開始而已。

那我該怎麼理解這兩種看上去矛盾的情緒?一邊是市場像要見頂了,一邊是AI的潛力看起來無限?

喬納森 價值這件事,有兩個維度:一個是稱重,一個是選美。

有些資產就是純選美,比如加密貨幣。我從來沒買過比特幣。我爲啥錯過了?因爲我不擅長玩「選美」。我不知道什麼會火,什麼不會火。對我來說,玩不轉的。

我唯一能做的,就是看得見價值。

而當我看向AI,我看到的是真正的、被兌現的價值。

最好的例子是,私募股權(PE)公司現在蜂擁而至。他們想獲得低成本的AI算力,因爲只要他們能拿到更多便宜的算力,就能直接改變他們被投企業的利潤底線。

這是實打實的價值。當PE公司開始搶某樣東西時,那絕對不是選美比賽,那是價值驅動。

公司之所以會獲得高估值,有兩種原因:一種是市場認定,這家公司未來能兌現價值;另一種是它陷入了炒作循環,變成了純粹的「選美比賽」。

市場上的參與者也不一樣,有的人只玩人氣投票,有的人真的在看基本面。他們也許會得出相同的投資結論,但出發點完全不同。

如果從價值的角度來看,或者說從「長期稱重機」的角度來看,經濟中最有價值的,其實是勞動力。而現在,通過提供更強的算力和更好的AI,我們實際上能夠向整個經濟體系裏注入更多「額外勞動力」。

這種事情,在人類經濟史上從未發生過。

哈里 你會不會擔心,在短期內如果我們遇到一點波折,鑑於當下價值如此高度集中,會不會使經濟的很大一部分被脫軌?

現在大家都在狂飆上漲,但如果英偉達、Meta、谷歌、微軟這些公司突然遇到「減速帶」,AI這列高速列車慢下來了,那它的乘數效應就會非常驚人。你擔心嗎?

喬納森 我確實會擔心。但這不是因爲AI本身沒有價值,而是因爲,這是系統過熱之後的自然反應。

你可以把市場想象成一個系統,它本來可以沿着健康軌道增長,但也可能因爲過熱而失控。

一旦過熱,人們就會不斷加碼,直到某個時刻突然意識到「撐不住了」,然後整個市場迅速回調,甚至跌破合理區間。

在這個過程中,很多原本不錯的公司,可能因爲信心崩盤、融資斷裂而倒下。

但我們也知道,每一次市場調整之後,都會出現一批真正優秀的新公司。

哈里 那你覺得未來一年會不會出現這種回調?

喬納森 這我真的沒法預測。

因爲預測的前提是:預測本身不能改變結果。但在經濟系統裏,很多時候預測本身就會引發反饋,那它就不再具備可預測性了。

比如一顆小行星正朝地球飛來——如果我們無力阻止,那就能準確預測它會撞上來。

但如果我們能預測,並因此研發出攔截手段,那預測本身就改變了結局。

你明白問題出在哪了嗎?

哈里 懂了。

喬納森 在經濟系統中,你甚至不需要改變「實際的東西」,只要資金流動的方向變了,系統就會劇烈波動。

正因爲這些反饋機制太敏感,所以經濟走勢很難預測。

我沒法告訴你明年經濟會怎樣。我唯一能說的,是我現在在AI領域看到的最大問題:

如果你發現一個優秀的工程師,就算你願意僱他,他可能也不會加入你,因爲他可以自己出去融到10萬、2000萬,甚至1億美元。

他會怎麼做?當然是去自己創業。

這就導致我們很難在一家初創公司裏聚攏關鍵人才。

但從另一個角度看,AI本身也在提升小團隊的效率,哪怕人才被分散了,事兒照樣能做成。

哈里 你覺得現在的市場,是不是已經有點過熱了?

喬納森 判斷市場是否過熱,有一個很簡單的指標:這個經濟系統有沒有在阻礙公司取得成功?如果沒有,那我不覺得它過熱。

哈里 但你看,現在資本太充足了,反而讓你們這些公司招不到好人。很多人拿到錢後,不願意加入Groq,而是自己出去創業……

喬納森 對啊,所以我現在都得說:「拜託你們,別再這樣了(笑)。」

不過話說回來,AI確實讓每個人都變得更高效了。

所以也許,即使經濟還在高歌猛進,各家公司依然能持續成功。

誰知道呢?我們從沒經歷過這樣的時代。

哈里 那現在的人才大戰,是不是已經瘋狂了?

喬納森 絕對是。這是有史以來最激烈的一次,但只發生在科技行業。

OpenAI和谷歌進入「雙雄爭霸」

哈里 我們看看體育行業,其實它一直都挺瘋狂的,尤其這幾年更甚。

你回頭看二三十年前,頂級運動員的薪資,也就和現在的科技從業者差不多。只不過,人們逐漸意識到,真正有價值的是那些頂尖人才。

但體育行業有很多限制:球隊數量有限,還有工資帽。科技行業完全不一樣,這裏沒有上限。你可以有無限支「球隊」、無限家初創公司。

你想想,如果誰都能組建自己的橄欖球隊,那球員的薪資會漲到什麼程度?整個聯賽的估值又會變成什麼樣?

那現在有沒有哪家公司讓你印象最深?又有沒有哪家讓你感到擔憂?

喬納森 我覺得變化最顯著的是谷歌。

谷歌長期有一個結構性優勢:公司文化允許工程師自由提出好點子,而管理層的職責就是別擋路。

這其實是一種很強的系統性優勢。

哈里 你覺得Gemini算是他們的一次成功嗎?

喬納森 算的。光看用戶使用量就很不錯了。

哈里 那你怎麼看Gemini在消費級產品裏的整合?

喬納森 老實說,還不夠好。它雖然被整合進了Gmail,但基本沒什麼人能真正用上。它也出現在其他產品裏,但感覺就像是倉促塞進去的,整體體驗還不成熟。

不過現在還不能下結論,至少他們正在通過這些入口收集用戶數據,這對未來產品方向會很有幫助。

這讓我想起當年的Google TV,一開始是個徹底的失敗,但他們不斷迭代,最終變成了Google Chrome。

這是一條典型的產品路徑:公司先推出一個半成品,捱罵,忍住,然後不斷優化,最後做出真正出色的產品。

哈里 但前提是你得有分發渠道的優勢,才能扛得住那些批評。而現在,OpenAI已經把這種先發優勢大大縮小了。

喬納森 確實如此。谷歌可能確實慢了一步。這其實就是一個經典問題:大公司能否在初創公司掌握分發之前完成創新?

現在的現實是,初創公司已經搶下了分發權。OpenAI的產品被全球10%的人口在使用,這太驚人了。你現在很難想象OpenAI會突然消失,我覺得基本不可能。

哈里 所以我們現在進入了「雙雄爭霸」階段?

喬納森 沒錯,就是OpenAI和谷歌。Anthropic其實做的是另一件事。

哈里 你是說,Anthropic更專注於代碼生成,而OpenAI和谷歌都聚焦在聊天機器人?

喬納森 OpenAI做聊天機器人,谷歌也做;谷歌做代碼生成,OpenAI同樣在做。

哈里 那你們團隊現在最常用哪個工具?

喬納森 最近,工程師更偏向用Codex,而不是Anthropic的工具。

哈里 哇哦。

喬納森 而且這個偏好幾乎是按月在變。

我們的原則是:不規定用哪個工具,但有一條鐵律——必須用AI。

不用AI,你根本沒有競爭力。

我們看到他們之前用Sourcegraph,後來用Enro,現在轉到Codex,下個月可能又切回Sourcegraph。

哈里 那在這麼頻繁切換的情況下,這些工具還有持久價值嗎?

喬納森 我們那批工程師都是一線的。哪個工具好,他們就馬上切過去。

當然不是所有人都這樣,但我們這個圈子裏很多人確實是。

但企業客戶不一樣。他們籤的是一年、甚至更久的合同,一般不會輕易更換工具。

OpenAI和Anthropic都被嚴重低估了

哈里 那如果現在讓你選:OpenAI估值5000億,Anthropic1800億,你投哪家?

喬納森 我兩個都投。

哈里 你會?!

喬納森 當然。它們都被嚴重低估了。

很多人還把它們當成是在一個有限市場中搶份額的競爭者。但實際上,他們做的事,是在不斷把這個市場的上限抬高。

哈里 那我們順着這個牛市邏輯往下推:這兩家公司能走多遠?

喬納森 我覺得現在的科技巨頭還能繼續漲很多。

但爲什麼AI實驗室不能追上來?「七巨頭」會漲,AI實驗室也能追上,這兩件事並不矛盾。

真正的問題是:AI實驗室最終會不會超過「七巨頭」?

聰投注:像OpenAI前首席科學家、聯合創始人伊利亞·蘇茨克維爾(Ilya Sutskever)2024另起爐竈,就是和團隊創辦了一個新的AI實驗室Safe Superintelligence(簡稱 SSI)。它的目標很硬核:不急着做產品和商業化,而是做更強的模型+更安全的對齊,走的是典型的「頂級研究團隊先建底座」的路線。)

哈里 你覺得決定因素是什麼?

喬納森 我不知道。但說真的,我覺得他們最終可能會融合出新的Mag Nine(九巨頭)。

哈里 那可能就不止是Mag 9,而是Mag 11、Mag 20了。你覺得AI實驗室未來會不會涉足應用層,把這一層也一併拿下?

喬納森 這是所有成功科技公司的自然路徑。它們開始做客戶原本在做的事,不斷上探技術棧,把客戶的業務一口吞掉。

然後又會有新一代創業者在它們頭上繼續搭建新層。

比如OpenAI。你們節目裏薩姆·奧爾特曼就說過一句話:如果你只是在OpenAI上做一點小修小補的產品,你很快會被淘汰。他只是在誠實地說出一個事實。

而我們這邊,選擇了一條不同的路:我們不做模型本身,不訓練自己的大模型。

這就像在地上畫了一條線:你可以放心在我們這層基礎設施上構建,因爲我們不會和你競爭。

當然,也可能我們錯了。也許哪天我們會被自己的客戶反向吞併。

但這也意味着,你可以信任我們不會動你的奶酪。

哈里 但這聽上去也是個挺花錢的決定。你要自己訓練模型,那得燒多少錢啊?

喬納森 非常燒錢。

哈里 說到錢,你們最近不是剛融資嗎?

喬納森 我們剛融了7.5億美元,估值差不多是70億美元。

哈里 太厲害了,恭喜!但說真的,夠用嗎?

喬納森 其實我們原本只打算融3億。

你剛才也提到盈利的問題。對我們這類做硬件的公司來說,其實還好。和做模型的公司不同,我們賣硬件是可以盈利的。

哈里 我還以爲你們的硬件是虧本賣的?

喬納森 不,我們賣硬件是賺錢的。

軟件就要看情況了。有些模型在我們芯片上跑是賺錢的,有些能覆蓋運營成本但資本開支回報不夠,我們對資本支出是很謹慎的。

賣硬件我們肯定是賺錢的。哪怕是那些利潤最薄的模型,只要我們芯片壽命夠長,依然有望盈利。現在我們只是還不知道這些芯片能撐多久。

哈里 那長期來看,你們的毛利率走勢如何?未來利潤率會不會越來越高?

喬納森 這就是我們作爲一傢俬營公司的小優勢之一,我可以選擇不告訴你。(笑)

哈里 但你要是願意說,那就太好了(笑)。

喬納森 我們能保留的好處也就剩這點了!

哈里 確實,你們沒有鎖倉期,退出也更靈活。

喬納森 但我從來沒賣過一股。真的,從來沒有。

哈里 那你可真不懂遊戲規則。(笑)回到利潤率本身,你們是怎麼看的?

喬納森 我還是堅持之前的觀點:只要業務不出現劇烈波動,我希望我們的利潤率越低越好。

利潤率的意義在於緩衝不確定性,當你需要資金時可以適當漲價,帶來現金流;但平時,價格應該儘量壓低。

現在對算力的需求極高。如果某個客戶非常着急,我們可以對他小幅提價,從而維持其他客戶的低價。

英偉達市值肯定會衝上10萬億美元

哈里 那你能預測一下五年後的芯片格局嗎?

喬納森 我認爲五年後,英偉達的營收份額仍會超過50%,但它的出貨量可能不到市場的一半。

哈里 你是說,它能拿到一半以上的收入,但只賣出了不到一半的芯片?

喬納森 對。品牌本身就值錢,能支撐更高的售價。但這也意味着它會「失去飢餓感」,利潤率很高,客戶還是會買——因爲買英偉達的產品,不容易出錯,不會被炒掉。

這是個好生意,依舊有價值。如果你投資英偉達,大概率不會錯。

哈里 但從客戶的角度看,現在這個市場的集中度非常高——也就三十來家公司,就佔了90%、甚至99%的採購支出。對他們來說,決策時絕不會只看品牌,而是要看哪種產品真正能提升自己的業務表現。所以,未來一定會有越來越多不同芯片加入競爭,因爲這些大客戶本身就擁有很強的議價能力。

你剛才說「投資英偉達基本不會錯」,那你怎麼看,五年後英偉達有沒有可能衝到10萬億美元市值?

喬納森 如果五年後它還沒到,我會很驚訝。不過真正該問的是:Groq能不能做到十萬億?

哈里 你覺得有可能嗎?

喬納森 當然有。我們不像英偉達那樣受限於供應鏈,現在我們是全世界最有能力擴產算力的公司。

而算力,正是這個時代最稀缺的資源。所有人都在高價搶算力,而我們可以幾乎無限地供給它。

哈里 那你覺得市場還沒理解Groq哪些價值?

喬納森 這得看是哪一個月。(笑)

比如「多用戶能力」這塊,大家原以爲我們做不到,結果我們展示了可以在同一塊芯片上並行支持多個用戶。

哈里 這是因爲你們用SRAM架構?

喬納森 沒錯。但你知道我被問得最多的問題是什麼嗎?「SRAM不比DRAM貴多了嗎?」

答案是,確實貴。

粗略說,SRAM每bit的成本大概是DRAM的3到4倍。這還是單就結構說的,不算其他開銷。

哈里 能簡單說說這兩者的區別嗎?

喬納森 打個不嚴謹的比方說,SRAM是芯片內部的內存,DRAM是外部內存。

設計上,SRAM要用6~8個晶體管,DRAM只用1個電容+1個晶體管,所以SRAM佔的硅面積更大,自然也更貴。我們還是在3納米制程上部署SRAM,成本更高。

綜合下來,SRAM每bit成本可能是DRAM的10倍。

但我們真正關注的,是系統層面的總成本。

比如我們跑Kimi模型,是在4000塊Groq芯片上部署的,而別人用8塊GPU。這意味着我們只需要保留一份模型副本,而GPU系統得保留500份,消耗的是500倍的內存。

所以雖然SRAM貴,但DRAM花的錢可能更多。這就是典型的「別隻看芯片單價,要看整個系統效率」。

現在我們已經從系統層面優化,拓展到全球層面了。

我們在全球有13個數據中心,覆蓋美國、加拿大、歐洲、中東。我們會根據不同區域的輸入輸出特徵,在不同數據中心部署最合適的模型。甚至有些中心完全不部署某些模型,而是由其他地區動態調度。

我們不是做單點最優,而是做全球負載均衡。

Groq現在要解決的核心問題是如何滿足巨大需求

哈里 那我問個哲學一點的問題:如果你現在完全不怕失敗,你會做什麼?

喬納森 換個角度說吧,我們現在還有哪些風險沒加碼?

有一個明顯的選擇是:把供應鏈訂單直接翻倍。我們的供應鏈響應週期是6個月,已經比幾乎所有公司都快。

哈里 那你們現在的供需缺口到底有多大?

喬納森 就說上週吧,有客戶找我們,說他們需要的是當前算力的5倍。我們不能簡單地說翻倍產能就夠了。你得讓產能不僅變多,還要足夠大。

所以我們的風險選擇是:要不要再翻一倍產能建設速度?

我們剛完成了一輪融資,本來計劃融3億,結果融7.5億美元,直接翻倍,而且超額認購了4倍。

我們其實可以融更多,只是我對稀釋比較謹慎,也在替投資人考慮。如果願意接受更多稀釋,我們完全可以新建更多算力中心。

而且我們還有一個關鍵優勢:在同樣推理速度下,我們的「每token成本」遠低於同行。

這意味着我們有更強的價格競爭力,而這,才是真正對客戶有價值的東西。

哈里 你是說客戶對價格這麼敏感?

喬納森 不是敏感,也不是摳門,而是因爲只要你把價格砍半,他們就能買兩倍的算力。每一塊錢的投入,都能直接提升模型的輸出質量。

哈里 你們未來會考慮上市嗎?

喬納森 我們現在的全部精力都放在執行層面。

上市是另一種玩法,而我們現在要解決的核心問題只有一個:能不能滿足市場對計算資源的巨大需求。

哈里 那你覺得Cerebras之前準備上市,後來又放棄,說明了什麼?

喬納森 他們不是最近才正式宣佈不上市了嗎?這就已經說明了一切(笑)。

不容錯過的快問快答環節

哈里 來玩一輪快問快答吧。現在大家對英偉達最大的誤解是什麼?

喬納森 以爲他們的軟件是護城河。CUDA的鎖定效應根本是個神話。

哈里 真的嗎?

喬納森 在訓練端也許是,但在推理端完全不是。我們現在已經有220萬註冊開發者在用Groq。英偉達說他們有600萬CUDA用戶?拭目以待吧。

哈里 如果你現在才創辦Groq,英偉達已經市值四萬億,AI熱潮已成,你還會選擇做芯片嗎?

喬納森 不會了。這條船已經開走,現在做芯片就太晚了。

哈里 可現在還有很多芯片初創公司剛剛起步,而且拿到不少大錢。你覺得他們也來晚了?

喬納森 太晚了。我當初之所以做芯片,是因爲我在谷歌做過TPU,也和Google Brain的朋友一起,在ResNet50上做過最強分類實驗,我們當時把所有模型全都擊敗了。

我完全可以去做算法,甚至做形式邏輯方向的AI。但我選了芯片,因爲芯片有時間護城河。

風投機構常會問我:「你們的模式別人能不能複製?」

我說:當然能。但他們永遠落後我們三年。

從設計到量產,哪怕執行完美也要三年。而我已經做了三個芯片項目,現在全部進入生產或準備量產階段。

而且我們還是A0 silicon(一次流片成功)。你知道全球有多少芯片能一次成功?只有14%。

哈里 所以每次流片失敗的概率是86%。那你們做V2芯片的時候也預留了失敗重做的預算嗎?

喬納森 當然,我們本來就計劃好第一次不成就再來一次。結果,出人意料地,一次就成功了。這是完全不可預期的。

所以我說「芯片開發週期是三年」,那是在一切順利的前提下。

英偉達也差不多三到四年開發一代,但他們是多條產品線並行推進。

而我們Groq已經進入了「一年一代」的節奏:V2之後是一年內推出V3,再一年是V4。

哈里 你怎麼看拉里·埃裏森和甲骨文的「二次崛起」?

喬納森 很聰明的商業判斷,加上非常快的執行力。

現在很多人都在猶豫:AI會不會過熱?我們該不該繼續投?而甲骨文的選擇是:直接上,不猶豫。

這就是贏的方法。你現在看到所謂的「貪婪市場」,其實只是少數幾位行動迅速的人在賺大錢。

哈里 如果我是投資人,哪些地方該貪婪,哪些地方該恐懼?

喬納森 你知道哈密爾頓·赫爾默的《七種力量》(7 Powers)吧?只要你能看到護城河,就該貪婪。

現實是,大多數公司根本沒有護城河,特別是在早期階段。

你要做的是:預判誰能構建出護城河。

所以我們應該給這種「護城河還沒建立」的項目起個新名字:pre‑mo,也就是pre‑moat的簡稱。

哈里 過去一年,你在哪些問題上改變了想法?

喬納森 嚴格說不是改變,而是不斷聚焦。我們現在對「yes」的門檻越來越高,反而讓業務變得更高效。

我以前覺得「保留選項」很重要,現在我覺得,聚焦才最重要。

當然,早期如果沒有廣泛嘗試,我們也不會走到今天。但現在,我們只做最可能贏的那條路徑。

哈里 你覺得埃隆·馬斯克能把Grok和xAI做成功嗎?

喬納森 我覺得可以,但它們的終局形態可能和別人不一樣。

每次出現一個新賽道,大家都以爲彼此是競爭關係,其實未必。Anthropic就做得很好,他們聚焦在代碼生成,做得極致。

xAI的策略是把chatbot融入社交場景,和社交網絡結合得很好。我不會用他們的模型去寫代碼、搞科研,雖然他們也有代碼模型,但他們沒有代碼的分發渠道。

市場會自然分化。就像現在的「七巨頭」,每家公司業務有重疊,但核心方向不同。如果你不能做出差異化,你就會被淘汰。

哈里 那你怎麼看谷歌、微軟、亞馬遜?三選一,你買誰,賣誰?

喬納森 這取決於你怎麼看時間維度。

短期內,微軟可能會有些調整,畢竟它和OpenAI的關係現在有點微妙。但從長期來看,他們沒問題,仍然很強。

哈里 你覺得這對微軟的打擊是實質性的嗎?

喬納森 不會。短期有影響,但長期無礙。

他們在OpenAI有股權,又能用Anthropic的工具,等於是「兩頭下注」。

再加上,他們已經投入了大量算力。哪怕OpenAI以後換算力供應商,微軟手裏的算力本身就是黃金,非常值錢。

至於亞馬遜,我覺得他們缺乏AI的基因。

你剛才沒提Meta,但Meta和谷歌一直有很強的AI文化。

微軟靠OpenAI補上了,而亞馬遜目前還沒補上。不過他們至少有基礎設施。

哈里 最後一個問題。我想用一個積極的話題收尾:未來五到七年,有什麼是你最期待的?

喬納森 我最期待的,反而是很多人感到害怕的東西。

我說的是,AI帶來的影響。

我們可以用伽利略做個類比。

幾百年前,伽利略讓望遠鏡普及開來。那時人們第一次通過望遠鏡看清宇宙,才意識到宇宙遠比想象更浩瀚,人類也因此顯得無比渺小。那一刻讓人恐懼。

但隨着時間推移,我們逐漸明白:雖然我們渺小,但宇宙卻更壯麗、更美。

今天,大語言模型(LLMs)就像「心智的望遠鏡」。它們讓我們感到自己的智能渺小,是因爲它們放大了「智能」這個概念的邊界。

但我相信,100年後我們會意識到:原來,智能的世界,比我們想象得要遼闊得多。那會是一件美麗的事。

想選股、想診股?想知持倉機會同風險?關於投資的一切問題,開口問牛牛AI就得啦!

編輯/joryn

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與天星銀行相關的任何投資建議。天星銀行竭力但無法保證上述全部內容的真實性、準確性和原創性。