訂閱
糾錯(cuò)
加入自媒體

英偉達(dá)為什么要花200 億美元“拿下”Groq ?

芝能智芯出品

2025 年 12 月,英偉達(dá)200 億美元通過技術(shù)授權(quán)與核心人才并入的方式,實(shí)質(zhì)性“吞下”了推理芯片公司 Groq 的內(nèi)核資產(chǎn)。

從現(xiàn)在來看,英偉達(dá)做的不是一筆常規(guī)意義上的并購,圍繞推理時(shí)代主導(dǎo)權(quán)展開的戰(zhàn)略性防御戰(zhàn)。

當(dāng)推理市場(chǎng)首次在規(guī)模上超過訓(xùn)練,當(dāng)超大規(guī)模云廠商全面推進(jìn)自研 ASIC,當(dāng)算法效率開始?jí)嚎s“算力”的邊際價(jià)值,英偉達(dá)思考如果 AI 推理不再天然依賴 GPU,那英偉達(dá)的溢價(jià)還成立嗎?Groq,恰恰站在這個(gè)問題最危險(xiǎn)的位置上。

Part 1Groq 的真正價(jià)值

Groq的語言處理單元(LPU)是一種專為AI推理設(shè)計(jì)的革命性芯片架構(gòu),與傳統(tǒng)GPU從圖形處理演變而來不同,LPU從零開始針對(duì)大型語言模型(LLM)的實(shí)時(shí)推理優(yōu)化,實(shí)現(xiàn)了低延遲、高效率的突破。

核心基于四個(gè)第一性原理:

 軟件優(yōu)先設(shè)計(jì),先構(gòu)建確定性編譯器再設(shè)計(jì)硬件,確保操作靜態(tài)調(diào)度、無需自定義內(nèi)核;

 可編程裝配線架構(gòu),像傳送帶一樣同步流動(dòng)數(shù)據(jù)通過計(jì)算單元,避免GPU的中心輻射式瓶頸;

 確定性執(zhí)行,消除緩存、分支預(yù)測(cè)等變異因素,每指令時(shí)延固定,提供可預(yù)測(cè)的亞毫秒級(jí)響應(yīng);

 片上SRAM內(nèi)存,提供數(shù)百M(fèi)B本地存儲(chǔ)和極高帶寬(遠(yuǎn)超GPU的片外HBM),數(shù)據(jù)本地化減少延遲并提升能效,結(jié)果是推理速度比GPU快10倍、功耗低10倍,尤其適合單用戶實(shí)時(shí)交互場(chǎng)景。

Groq專注推理專精,通過模塊化流水線線性擴(kuò)展、無外部交換機(jī),實(shí)現(xiàn)低成本、高確定性性能,2025年9月融資7.5億美元估值69億美元。

在過去兩年里,Groq 頻繁以“每秒 500+ Token”“毫秒級(jí)確定性延遲”刷屏技術(shù)社區(qū)。但如果剝離所有營銷語言,Groq 的性能優(yōu)勢(shì)其實(shí)高度單一,把模型權(quán)重放進(jìn)了 SRAM,直接用大容量片上 SRAM 作為主存儲(chǔ)。

在大模型推理中,計(jì)算單元并不稀缺,真正稀缺的是權(quán)重被調(diào)入的速度和數(shù)據(jù)在芯片內(nèi)外移動(dòng)的延遲和能耗。傳統(tǒng) GPU的瓶頸不在算力,而在 HBM 到 SM 的數(shù)據(jù)路徑上,HBM 本質(zhì)仍是 DRAM,訪問延遲在百納秒量級(jí)。

Groq 的激進(jìn)之處在于用極其昂貴、極其低延遲的 SRAM,計(jì)算單元可以持續(xù)滿負(fù)載運(yùn)轉(zhuǎn)。

 延遲:從百納秒降到單時(shí)鐘周期

 帶寬:等效片上帶寬數(shù)量級(jí)提升

 能耗:幾乎消除“搬數(shù)據(jù)”的能量浪費(fèi)

確定性延遲、VLIW、復(fù)雜編譯器是為了服務(wù) SRAM 路線不得不付出的工程代價(jià),如果沒有 SRAM 帶來的帶寬和延遲優(yōu)勢(shì):確定性沒有商業(yè)意義、編譯器復(fù)雜度只會(huì)成為負(fù)擔(dān)和VLIW 不具備通用競(jìng)爭力,Groq成為英偉達(dá)眼中的“危險(xiǎn)變量”。

從財(cái)務(wù)角度看,這是一筆極不理性的交易,Groq 營收規(guī)模數(shù)億美元,商業(yè)化難度極高,芯片成本結(jié)構(gòu)長期不具備規(guī)模優(yōu)勢(shì),英偉達(dá)當(dāng)然清楚這一切,這 200 億美元,買的是“排他性”。

Part 2真正的威脅來自誰?

如果 Groq 被一家初創(chuàng)公司持有,威脅有限; 但如果 Groq 被超大規(guī)模云服務(wù)商收購,性質(zhì)完全不同。

谷歌、亞馬遜、微軟具備三種 Groq 自己不具備的能力:無限級(jí)別的資本投入、數(shù)據(jù)中心級(jí)系統(tǒng)整合能力,用低價(jià)推理服務(wù)“反向打擊 GPU 租賃市場(chǎng)”的動(dòng)機(jī)。

一旦 SRAM 推理路徑被整合進(jìn)云基礎(chǔ)設(shè)施,并被大規(guī)模攤薄成本,英偉達(dá) GPU 在推理端的定價(jià)邏輯將遭遇根本性挑戰(zhàn),這是估值體系之爭。

英偉達(dá)今天的市值,建立在一個(gè)核心敘事之上,GPU 是 AI 的唯一通用基礎(chǔ)設(shè)施。如果推理可以繞過 GPU,用另一種更高效、更低延遲的路徑完成,那么英偉達(dá)必然被重估,損失也是數(shù)千億美元級(jí)別。

在這個(gè)背景下,200 億美元不是“溢價(jià)”,而是極低成本的估值保險(xiǎn)。

最近達(dá)模型的發(fā)展,不斷證明通過架構(gòu)優(yōu)化、精度管理、稀疏計(jì)算,可以在更低配置硬件上,完成接近甚至超過主流模型的推理效果,當(dāng)“更聰明的模型”開始減少對(duì) FLOPS 的依賴,硬件競(jìng)爭變成了,能把每一次數(shù)據(jù)移動(dòng)榨干。

Groq 團(tuán)隊(duì),尤其是來自 TPU 體系的核心人物,可以帶來以極致數(shù)據(jù)路徑為中心的設(shè)計(jì)哲學(xué)。

為什么是“授權(quán) + 人才”,而不是直接并購?答案很簡單:監(jiān)管與控制的最優(yōu)解。

完整并購會(huì)觸發(fā)反壟斷,純投資導(dǎo)致控制力不足,于是出現(xiàn)了 2025 年大廠最常見的方案,法律上獨(dú)立,技術(shù)上抽空,人才上收編,Groq 仍然存在,GroqCloud 仍然運(yùn)營,真正能推動(dòng)下一代架構(gòu)演進(jìn)的人,已經(jīng)被英偉達(dá)控制住了。

小結(jié)

英偉達(dá)買下的是“解釋權(quán)”,Groq 的技術(shù)本身,并不足以顛覆英偉達(dá),但 Groq 所代表的那條物理路徑,有這個(gè)潛力。英偉達(dá)只需要確保這條路不會(huì)成為“英偉達(dá)之外的標(biāo)準(zhǔn)”,不會(huì)被云廠商掌握,200 億美元,換來的正是這一切。

       原文標(biāo)題 : 英偉達(dá)為什么要花200 億美元“拿下”Groq ?

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    智能制造 獵頭職位 更多
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)