訂閱
糾錯(cuò)
加入自媒體

中美大模型“登月路”:谷歌與月之暗面的這一年

圖片

文|魏琳華

編|王一粟

兩年前,面對(duì)OpenAI的突襲,節(jié)節(jié)敗退的谷歌內(nèi)部拉響了“紅色警報(bào)”。

為了應(yīng)對(duì)這場(chǎng)可能動(dòng)搖到谷歌根本業(yè)務(wù)——搜索的危機(jī),谷歌作出了一個(gè)重大決定:2023年4月,谷歌將兩個(gè)頂尖實(shí)驗(yàn)室Google Brain和DeepMind的成員抽調(diào)出來(lái),組建新團(tuán)隊(duì)Google DeepMind。

新誕生的超級(jí)團(tuán)隊(duì),將他們的賭注押在一個(gè)名為“Gemini”的項(xiàng)目上。

谷歌的命名有兩重意義,它的直譯為“雙子座”,象征著谷歌內(nèi)部?jī)纱箜敿?jí)技術(shù)力量的合體。而在航天史上,Gemini也有著極為重要的意義——它是NASA著名登月計(jì)劃之一“阿波羅計(jì)劃”的關(guān)鍵鋪墊。

“我立刻被這個(gè)名字吸引,因?yàn)橛?xùn)練大型語(yǔ)言模型的巨大努力與發(fā)射火箭的精神產(chǎn)生了某種深刻的共鳴。”談到命名由來(lái),DeepMind副總裁、Gemini聯(lián)合技術(shù)負(fù)責(zé)人Oriol Vinyals說(shuō)。

然而,現(xiàn)實(shí)的引力比火箭的推力更沉重。

Gemini計(jì)劃剛成形時(shí),是谷歌被質(zhì)疑最猛烈的日子。被對(duì)手OpenAI卡點(diǎn)發(fā)布新模型,屢屢被后者搶走風(fēng)頭、Gemini 1.0的演示視頻翻車、新模型性能優(yōu)勢(shì)不及對(duì)手。樁樁件件,讓谷歌難以擺脫外界質(zhì)疑的聲音。

但科技行業(yè)的魅力在于,只要真的向技術(shù)投入,就總會(huì)有翻身的那一天。

兩年后的今天,當(dāng)Gemini 3橫空出世,多項(xiàng)指標(biāo)超過(guò)GPT-5.1,谷歌終于揚(yáng)眉吐氣。

最近,谷歌被曝出正在探索一項(xiàng)名為“moonshot”的登月計(jì)劃,即在太空中建造人工智能數(shù)據(jù)中心,打造一系列配備谷歌人工智能芯片的太陽(yáng)能衛(wèi)星,這也是該公司為追趕 OpenAI 和其他競(jìng)爭(zhēng)對(duì)手而采取的最新舉措。

谷歌首席執(zhí)行官桑達(dá)爾·皮查伊也在采訪中表示,為登月計(jì)劃感到自豪。

圖片

AI 2.0時(shí)代的落地狂奔中,谷歌的故事是這一代AI公司的最佳縮影。不同于AI 1.0時(shí)代技術(shù)快速觸及天花板,導(dǎo)致后期的比拼淪為卷落地、卷資金的規(guī)模戰(zhàn);AI 2.0時(shí)代的公司們,至今面對(duì)的頭號(hào)任務(wù)依然是卷技術(shù)。

中美模型的競(jìng)爭(zhēng)中,來(lái)自中國(guó)的月之暗面(Moonshot AI)很早也提出過(guò)自己的“登月計(jì)劃”,如同楊植麟對(duì)公司的命名期待,深耕技術(shù),注重“月球背面的探索”。

11月30日,美國(guó)NBC News報(bào)道,隨著中國(guó)開(kāi)源生態(tài)的崛起,以Kimi K2 Thinking模型為代表的中國(guó)頂尖模型,性能接近美國(guó)最優(yōu)秀的水平。

圖片

這背后,是沉寂半年、卷土重來(lái)的月之暗面,也靠“登月計(jì)劃”打的一場(chǎng)翻身仗。

今年下半年,月之暗面先后拿出了兩個(gè)奠定地位的模型Kimi K2和Kimi K2 Thinking。前者作為非思考模型,在多個(gè)測(cè)試中拿到開(kāi)源模型的SOTA;后者不僅能力大幅升級(jí),還成為著名AI搜索Perplexity目前唯一接入的國(guó)產(chǎn)模型,同時(shí)被官宣的,正是剛剛屠榜的Gemini3 Pro。而上一個(gè)有此待遇的中國(guó)模型,是風(fēng)光無(wú)限的DeepSeekR1。

圖片

在2025年交匯的兩條“登月路線”,再度強(qiáng)調(diào)了技術(shù)紅利對(duì)一家公司的重要性。

沒(méi)有永久的王座,AI賽道頻繁上演“逆襲”

科技商業(yè)史的宏大敘事中,從來(lái)沒(méi)有永久的王座。

在“一天一變”的AI賽道,技術(shù)的迭代速度以周甚至以天為單位計(jì)算,“逆襲”和“被逆襲”的戲碼幾乎每天都在上演。

細(xì)數(shù)三年,我們經(jīng)歷了多個(gè)靠技術(shù)翻盤的時(shí)刻:OpenAI靠ChatGPT超越一眾科技大廠、月之暗面憑借長(zhǎng)文本捧紅AI助手Kimi、再是Claude系列模型反殺OpenAI,靠編程一騎絕塵、DeepSeek出圈、以Kimi K2為代表的國(guó)產(chǎn)模型在海外走紅,最近的Gemini系列翻盤。

舊王推翻新王的故事,正在OpenAI和谷歌的身上輪回。

據(jù)外媒The Information報(bào)道,本周,OpenAI CEO Sam Altman拉響紅色警報(bào)。讓這家AI獨(dú)角獸警戒的對(duì)象,正是三年前對(duì)其同樣啟動(dòng)紅色警報(bào)的谷歌。

對(duì)于谷歌來(lái)說(shuō),2023到2024年是其最脆弱的時(shí)期。發(fā)布會(huì)上的事實(shí)性錯(cuò)誤曾讓市值一夜蒸發(fā)千億;Gemini早期的演示視頻被指責(zé)夸大宣傳;每一次試圖反擊,似乎都會(huì)被OpenAI更驚艷的產(chǎn)品搶走風(fēng)頭。

復(fù)盤兩年來(lái)的努力,Google CEOSundar Pichai一再?gòu)?qiáng)調(diào)全棧能力的重要性。

“在這個(gè)過(guò)程中,我們大幅加大了基礎(chǔ)設(shè)施投資——數(shù)據(jù)中心、TPU、GPU 等等。接下來(lái),就是如何確保我們能把 Gemini 整合進(jìn)所有的產(chǎn)品里。”Pichai說(shuō),“你把框架拉遠(yuǎn)一點(diǎn)看,就會(huì)覺(jué)得極度振奮。因?yàn)楫?dāng)你采用全棧方法論時(shí),每一層的創(chuàng)新會(huì)沿著整條鏈路向上傳遞。”

谷歌正式吹響反擊的號(hào)角,始于2025年3月。

彼時(shí),OpenAI慣用一種套路針對(duì)谷歌,即卡中其新模型的發(fā)布時(shí)間,提前一天發(fā)布自家產(chǎn)品。而這一次,谷歌“以其人之道還治其人之身”,把Gemini 2.5 Pro的發(fā)布提前到OpenAI產(chǎn)品發(fā)布的前一天。Gemini 2.5 Pro也不負(fù)眾望,在多項(xiàng)指標(biāo)上超過(guò)O3-mini,站上了最強(qiáng)模型的競(jìng)技場(chǎng)。

圖片

隨后,谷歌如同打開(kāi)了軍火庫(kù),陸續(xù)掏出了驚艷業(yè)界的原生多模態(tài)模型VEO 3、圖片編輯模型Nano Banana,一系列超越同期競(jìng)品表現(xiàn)的產(chǎn)品接踵而至。

最終, Gemini 3 成為那個(gè)引爆 OpenAI 的關(guān)鍵產(chǎn)品。從測(cè)試結(jié)果來(lái)看,這個(gè)新模型實(shí)現(xiàn)了對(duì) GPT-5.1 的全面超越,在數(shù)學(xué)競(jìng)賽、推理、多模態(tài)等能力上超越了 Claude Sonnet 4.5 和 GPT-5.1 。

圖片

無(wú)獨(dú)有偶,這種劇情,也在月之暗面身上發(fā)生。

半年前,這家公司還處在輿論的風(fēng)暴眼中。盡管Kimi曾憑借長(zhǎng)文本脫穎而出,但隨著DeepSeek橫空出世的推理模型R1靠技術(shù)破圈,一個(gè)問(wèn)題降臨在所有AI創(chuàng)業(yè)公司身上——“為什么xx沒(méi)有成為DeepSeek?”

在此之后,月之暗面沉寂了半年時(shí)間。

看到DeepSeek后,月之暗面創(chuàng)始人楊植麟在內(nèi)部會(huì)議上給出了相當(dāng)激進(jìn)的決策:不再更新 K1系列模型,將公司核心資源押注算法和下一代模型K2的研發(fā)上。

對(duì)比谷歌,作為國(guó)內(nèi)AI創(chuàng)企,月之暗面的處境相當(dāng)嚴(yán)苛。沒(méi)有數(shù)十年的數(shù)據(jù)積累,也沒(méi)有可以和國(guó)內(nèi)外巨頭抗衡的資源,和海外AI創(chuàng)企動(dòng)輒千億美元的估值相比,月之暗面目前估值還不到40億美元,這不僅是月之暗面一家的問(wèn)題,更是國(guó)內(nèi)大模型創(chuàng)業(yè)公司的共同困境。

圖片

利用有限的資源,月之暗面在半年后,也打了一個(gè)翻身仗。

先是今年7月Kimi K2模型發(fā)布,它是當(dāng)時(shí)開(kāi)源模型中少數(shù)能達(dá)到萬(wàn)億參數(shù)的大模型,作為非思考模型,它在多項(xiàng)指標(biāo)上拿下開(kāi)源模型梯隊(duì)的SOTA。

上個(gè)月,Kimi K2 Thinking模型正式上線時(shí),在HLE、推理、Agent等維度上超越閉源模型GPT-5和Claude Sonnet 4.5,重新回到全球開(kāi)源模型的榜首。

圖片

“這是另一個(gè)DeepSeek時(shí)刻嗎?”Kimi K2 Thinking模型發(fā)布后,Hugging Face 聯(lián)合創(chuàng)始人Thomas Wolf在X上這樣評(píng)價(jià)。

模型背后,也看到月之暗面在基礎(chǔ)技術(shù)上的追求。

比如全球首次在萬(wàn)億級(jí)別的模型預(yù)訓(xùn)練中采用二階優(yōu)化器 Muon,官方表示,Kimi K2提升了訓(xùn)練穩(wěn)定性和Token使用效率,在完成15.5T token平穩(wěn)訓(xùn)練的同時(shí),全程無(wú)Loss Spike(損失激增);推出下一代 Kimi Delta Attention 架構(gòu),通過(guò)混合線性注意力機(jī)制幫助提升模型的推理效果的同時(shí),還能降低幾倍的推理成本。

“你可能會(huì)認(rèn)為我們選擇Muon只是運(yùn)氣好,但是選擇的背后是,有幾十個(gè)優(yōu)化器和架構(gòu)沒(méi)有通過(guò)考驗(yàn)。”在月之暗面發(fā)起的AMA(Ask Me Everything)活動(dòng)上,團(tuán)隊(duì)給出了這樣的回答。

谷歌和月之暗面,也只是AI進(jìn)化的縮影。如今,AI行業(yè)遠(yuǎn)遠(yuǎn)未到逆襲的終點(diǎn)。

“當(dāng)前環(huán)境是史上最激烈的競(jìng)爭(zhēng),唯一真正重要的是進(jìn)步速度。”DeepMind CEO Demis Hassabis說(shuō)。

AI 2.0時(shí)代,技術(shù)紅利依然是關(guān)鍵

“逆襲”還是“被逆襲”,AI 2.0時(shí)代,大模型公司們的“長(zhǎng)跑考試”還在繼續(xù),技術(shù)依然是引領(lǐng)企業(yè)的引擎。

這與上一輪AI浪潮有著本質(zhì)的區(qū)別;赝2016年,當(dāng)AlphaGo點(diǎn)燃AI 1.0時(shí)代時(shí),技術(shù)泛化問(wèn)題難以解決的情況下,行業(yè)快速觸摸到了天花板。

計(jì)算機(jī)視覺(jué)(CV)來(lái)說(shuō),當(dāng)時(shí)業(yè)內(nèi)面對(duì)的問(wèn)題更加棘手,比如性能非常依賴大規(guī)模標(biāo)注數(shù)據(jù)、技術(shù)泛化性差、實(shí)時(shí)處理的延遲問(wèn)題等等。在技術(shù)瓶頸的情況下,拼資源、拼生態(tài)成了創(chuàng)業(yè)公司競(jìng)爭(zhēng)的關(guān)鍵。

但AI 2.0時(shí)代完全不同。在生成式AI時(shí)代行業(yè)距離天花板尚且遙遠(yuǎn),整個(gè)領(lǐng)域還有大量未解的問(wèn)題。

在大語(yǔ)言模型領(lǐng)域,Scaling Law(規(guī)模定律)的放緩問(wèn)題沒(méi)有得到有效解決;再看多模態(tài)大模型,包括自回歸和離散兩條技術(shù)路線還在探索中,沒(méi)有確切的答案;視頻生成的時(shí)長(zhǎng)、一致性、物理規(guī)律的學(xué)習(xí),還有提升空間;Agent的落地,更是卡在模型泛化能力的瓶頸上。

在這個(gè)階段,如果一家公司過(guò)早放棄作為基座的模型能力提升。“地基”不穩(wěn)的情況下,很容易被后起之秀彎道超車。

2025年,回歸技術(shù)更是成為AI行業(yè)的關(guān)鍵詞。

可以看到,無(wú)論是大廠還是小廠,都在招兵買馬,集中資源攻克模型SOTA。

不僅僅是谷歌和月之暗面,最近,國(guó)內(nèi)包括字節(jié)跳動(dòng)、百度等大廠都在進(jìn)行組織架構(gòu)調(diào)整,核心邏輯是提升大模型研發(fā)的優(yōu)先級(jí)。

上月末,百度TPG組織架構(gòu)大調(diào)整,文心業(yè)務(wù)拆分為基礎(chǔ)模型和應(yīng)用模型部門,負(fù)責(zé)人直接向百度CEO李彥宏匯報(bào);今年4月,字節(jié)AI Lab整體并入Seed團(tuán)隊(duì),整合AI研發(fā)力量。

對(duì)技術(shù)的投入,永遠(yuǎn)是留在第一梯隊(duì)的關(guān)鍵砝碼。谷歌的路徑已經(jīng)給出了最好的示范。在Gemini 2.5 Pro的逆襲之后,同樣隸屬于Gemini家族的圖像編輯模型Nano Banana(Gemini 2.5 Flash)也快速走紅?梢哉f(shuō),沒(méi)有強(qiáng)大的、通用的Gemini基座在語(yǔ)言和視覺(jué)理解上的突破,谷歌難以在短時(shí)間內(nèi)拿出一個(gè)同樣具備競(jìng)爭(zhēng)力的圖像模型。

當(dāng)基礎(chǔ)模型的研發(fā)取得突破,在這個(gè)基座上,公司們能夠靠“舉一反三”,在更多領(lǐng)域拿下優(yōu)勢(shì)。

此前,月之暗面團(tuán)隊(duì)在海外社交媒體上做AMA分享時(shí),雖然沒(méi)有具體預(yù)告K3模型的發(fā)布時(shí)間,但表示該模型有望用上他們研發(fā)的KDA(Kernel-Attention Dual Architecture)架構(gòu)。有接近月之暗面的人士對(duì)光錐智能表示,萬(wàn)億參數(shù)可以為后續(xù)的推理模型打下扎實(shí)地基,K2的多模態(tài)已經(jīng)在路上。

無(wú)論規(guī)模、體量,包括模型的性能,兩家同樣有著登月追求的公司都存在客觀差距,如同中美競(jìng)賽中那道逐漸縮小的鴻溝,東西方的技術(shù)和開(kāi)閉源之爭(zhēng)正等待著下一個(gè)奇點(diǎn)的降臨。

       原文標(biāo)題 : 中美大模型“登月路”:谷歌與月之暗面的這一年

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)