英偉達(dá)為什么要花200 億美元“拿下”Groq ？

2025-12-26 13:37

芝能智芯出品

2025 年 12 月，英偉達(dá)200 億美元通過技術(shù)授權(quán)與核心人才并入的方式，實(shí)質(zhì)性“吞下”了推理芯片公司 Groq 的內(nèi)核資產(chǎn)。

從現(xiàn)在來看，英偉達(dá)做的不是一筆常規(guī)意義上的并購，圍繞推理時(shí)代主導(dǎo)權(quán)展開的戰(zhàn)略性防御戰(zhàn)。

當(dāng)推理市場(chǎng)首次在規(guī)模上超過訓(xùn)練，當(dāng)超大規(guī)模云廠商全面推進(jìn)自研 ASIC，當(dāng)算法效率開始?jí)嚎s“算力”的邊際價(jià)值，英偉達(dá)思考如果 AI 推理不再天然依賴 GPU，那英偉達(dá)的溢價(jià)還成立嗎？Groq，恰恰站在這個(gè)問題最危險(xiǎn)的位置上。

Part 1Groq 的真正價(jià)值

Groq的語言處理單元（LPU）是一種專為AI推理設(shè)計(jì)的革命性芯片架構(gòu)，與傳統(tǒng)GPU從圖形處理演變而來不同，LPU從零開始針對(duì)大型語言模型（LLM）的實(shí)時(shí)推理優(yōu)化，實(shí)現(xiàn)了低延遲、高效率的突破。

核心基于四個(gè)第一性原理：

◎ 軟件優(yōu)先設(shè)計(jì)，先構(gòu)建確定性編譯器再設(shè)計(jì)硬件，確保操作靜態(tài)調(diào)度、無需自定義內(nèi)核；

◎ 可編程裝配線架構(gòu)，像傳送帶一樣同步流動(dòng)數(shù)據(jù)通過計(jì)算單元，避免GPU的中心輻射式瓶頸；

◎ 確定性執(zhí)行，消除緩存、分支預(yù)測(cè)等變異因素，每指令時(shí)延固定，提供可預(yù)測(cè)的亞毫秒級(jí)響應(yīng)；

◎ 片上SRAM內(nèi)存，提供數(shù)百M(fèi)B本地存儲(chǔ)和極高帶寬（遠(yuǎn)超GPU的片外HBM），數(shù)據(jù)本地化減少延遲并提升能效，結(jié)果是推理速度比GPU快10倍、功耗低10倍，尤其適合單用戶實(shí)時(shí)交互場(chǎng)景。

Groq專注推理專精，通過模塊化流水線線性擴(kuò)展、無外部交換機(jī)，實(shí)現(xiàn)低成本、高確定性性能，2025年9月融資7.5億美元估值69億美元。

在過去兩年里，Groq 頻繁以“每秒 500+ Token”“毫秒級(jí)確定性延遲”刷屏技術(shù)社區(qū)。但如果剝離所有營銷語言，Groq 的性能優(yōu)勢(shì)其實(shí)高度單一，把模型權(quán)重放進(jìn)了 SRAM，直接用大容量片上 SRAM 作為主存儲(chǔ)。

在大模型推理中，計(jì)算單元并不稀缺，真正稀缺的是權(quán)重被調(diào)入的速度和數(shù)據(jù)在芯片內(nèi)外移動(dòng)的延遲和能耗。傳統(tǒng) GPU的瓶頸不在算力，而在 HBM 到 SM 的數(shù)據(jù)路徑上，HBM 本質(zhì)仍是 DRAM，訪問延遲在百納秒量級(jí)。

Groq 的激進(jìn)之處在于用極其昂貴、極其低延遲的 SRAM，計(jì)算單元可以持續(xù)滿負(fù)載運(yùn)轉(zhuǎn)。

◎ 延遲：從百納秒降到單時(shí)鐘周期

◎ 帶寬：等效片上帶寬數(shù)量級(jí)提升

◎ 能耗：幾乎消除“搬數(shù)據(jù)”的能量浪費(fèi)

確定性延遲、VLIW、復(fù)雜編譯器是為了服務(wù) SRAM 路線不得不付出的工程代價(jià)，如果沒有 SRAM 帶來的帶寬和延遲優(yōu)勢(shì)：確定性沒有商業(yè)意義、編譯器復(fù)雜度只會(huì)成為負(fù)擔(dān)和VLIW 不具備通用競(jìng)爭力，Groq成為英偉達(dá)眼中的“危險(xiǎn)變量”。

從財(cái)務(wù)角度看，這是一筆極不理性的交易，Groq 營收規(guī)模數(shù)億美元，商業(yè)化難度極高，芯片成本結(jié)構(gòu)長期不具備規(guī)模優(yōu)勢(shì)，英偉達(dá)當(dāng)然清楚這一切，這 200 億美元，買的是“排他性”。

Part 2真正的威脅來自誰？

如果 Groq 被一家初創(chuàng)公司持有，威脅有限；但如果 Groq 被超大規(guī)模云服務(wù)商收購，性質(zhì)完全不同。

谷歌、亞馬遜、微軟具備三種 Groq 自己不具備的能力：無限級(jí)別的資本投入、數(shù)據(jù)中心級(jí)系統(tǒng)整合能力，用低價(jià)推理服務(wù)“反向打擊 GPU 租賃市場(chǎng)”的動(dòng)機(jī)。

一旦 SRAM 推理路徑被整合進(jìn)云基礎(chǔ)設(shè)施，并被大規(guī)模攤薄成本，英偉達(dá) GPU 在推理端的定價(jià)邏輯將遭遇根本性挑戰(zhàn)，這是估值體系之爭。

英偉達(dá)今天的市值，建立在一個(gè)核心敘事之上，GPU 是 AI 的唯一通用基礎(chǔ)設(shè)施。如果推理可以繞過 GPU，用另一種更高效、更低延遲的路徑完成，那么英偉達(dá)必然被重估，損失也是數(shù)千億美元級(jí)別。

在這個(gè)背景下，200 億美元不是“溢價(jià)”，而是極低成本的估值保險(xiǎn)。

最近達(dá)模型的發(fā)展，不斷證明通過架構(gòu)優(yōu)化、精度管理、稀疏計(jì)算，可以在更低配置硬件上，完成接近甚至超過主流模型的推理效果，當(dāng)“更聰明的模型”開始減少對(duì) FLOPS 的依賴，硬件競(jìng)爭變成了，能把每一次數(shù)據(jù)移動(dòng)榨干。

Groq 團(tuán)隊(duì)，尤其是來自 TPU 體系的核心人物，可以帶來以極致數(shù)據(jù)路徑為中心的設(shè)計(jì)哲學(xué)。

為什么是“授權(quán) + 人才”，而不是直接并購？答案很簡單：監(jiān)管與控制的最優(yōu)解。

完整并購會(huì)觸發(fā)反壟斷，純投資導(dǎo)致控制力不足，于是出現(xiàn)了 2025 年大廠最常見的方案，法律上獨(dú)立，技術(shù)上抽空，人才上收編，Groq 仍然存在，GroqCloud 仍然運(yùn)營，真正能推動(dòng)下一代架構(gòu)演進(jìn)的人，已經(jīng)被英偉達(dá)控制住了。

小結(jié)

英偉達(dá)買下的是“解釋權(quán)”，Groq 的技術(shù)本身，并不足以顛覆英偉達(dá)，但 Groq 所代表的那條物理路徑，有這個(gè)潛力。英偉達(dá)只需要確保這條路不會(huì)成為“英偉達(dá)之外的標(biāo)準(zhǔn)”，不會(huì)被云廠商掌握，200 億美元，換來的正是這一切。

原文標(biāo)題 : 英偉達(dá)為什么要花200 億美元“拿下”Groq ？