中美大模型“登月路”：谷歌與月之暗面的這一年

2025-12-05 18:30

文｜魏琳華

編｜王一粟

兩年前，面對(duì)OpenAI的突襲，節(jié)節(jié)敗退的谷歌內(nèi)部拉響了“紅色警報(bào)”。

為了應(yīng)對(duì)這場(chǎng)可能動(dòng)搖到谷歌根本業(yè)務(wù)——搜索的危機(jī)，谷歌作出了一個(gè)重大決定：2023年4月，谷歌將兩個(gè)頂尖實(shí)驗(yàn)室Google Brain和DeepMind的成員抽調(diào)出來(lái)，組建新團(tuán)隊(duì)Google DeepMind。

新誕生的超級(jí)團(tuán)隊(duì)，將他們的賭注押在一個(gè)名為“Gemini”的項(xiàng)目上。

谷歌的命名有兩重意義，它的直譯為“雙子座”，象征著谷歌內(nèi)部?jī)纱箜敿?jí)技術(shù)力量的合體。而在航天史上，Gemini也有著極為重要的意義——它是NASA著名登月計(jì)劃之一“阿波羅計(jì)劃”的關(guān)鍵鋪墊。

“我立刻被這個(gè)名字吸引，因?yàn)橛?xùn)練大型語(yǔ)言模型的巨大努力與發(fā)射火箭的精神產(chǎn)生了某種深刻的共鳴。”談到命名由來(lái)，DeepMind副總裁、Gemini聯(lián)合技術(shù)負(fù)責(zé)人Oriol Vinyals說(shuō)。

然而，現(xiàn)實(shí)的引力比火箭的推力更沉重。

Gemini計(jì)劃剛成形時(shí)，是谷歌被質(zhì)疑最猛烈的日子。被對(duì)手OpenAI卡點(diǎn)發(fā)布新模型，屢屢被后者搶走風(fēng)頭、Gemini 1.0的演示視頻翻車、新模型性能優(yōu)勢(shì)不及對(duì)手。樁樁件件，讓谷歌難以擺脫外界質(zhì)疑的聲音。

但科技行業(yè)的魅力在于，只要真的向技術(shù)投入，就總會(huì)有翻身的那一天。

兩年后的今天，當(dāng)Gemini 3橫空出世，多項(xiàng)指標(biāo)超過(guò)GPT-5.1，谷歌終于揚(yáng)眉吐氣。

最近，谷歌被曝出正在探索一項(xiàng)名為“moonshot”的登月計(jì)劃，即在太空中建造人工智能數(shù)據(jù)中心，打造一系列配備谷歌人工智能芯片的太陽(yáng)能衛(wèi)星，這也是該公司為追趕 OpenAI 和其他競(jìng)爭(zhēng)對(duì)手而采取的最新舉措。

谷歌首席執(zhí)行官桑達(dá)爾·皮查伊也在采訪中表示，為登月計(jì)劃感到自豪。

AI 2.0時(shí)代的落地狂奔中，谷歌的故事是這一代AI公司的最佳縮影。不同于AI 1.0時(shí)代技術(shù)快速觸及天花板，導(dǎo)致后期的比拼淪為卷落地、卷資金的規(guī)模戰(zhàn)；AI 2.0時(shí)代的公司們，至今面對(duì)的頭號(hào)任務(wù)依然是卷技術(shù)。

中美模型的競(jìng)爭(zhēng)中，來(lái)自中國(guó)的月之暗面（Moonshot AI）很早也提出過(guò)自己的“登月計(jì)劃”，如同楊植麟對(duì)公司的命名期待，深耕技術(shù)，注重“月球背面的探索”。

11月30日，美國(guó)NBC News報(bào)道，隨著中國(guó)開(kāi)源生態(tài)的崛起，以Kimi K2 Thinking模型為代表的中國(guó)頂尖模型，性能接近美國(guó)最優(yōu)秀的水平。

這背后，是沉寂半年、卷土重來(lái)的月之暗面，也靠“登月計(jì)劃”打的一場(chǎng)翻身仗。

今年下半年，月之暗面先后拿出了兩個(gè)奠定地位的模型Kimi K2和Kimi K2 Thinking。前者作為非思考模型，在多個(gè)測(cè)試中拿到開(kāi)源模型的SOTA；后者不僅能力大幅升級(jí)，還成為著名AI搜索Perplexity目前唯一接入的國(guó)產(chǎn)模型，同時(shí)被官宣的，正是剛剛屠榜的Gemini3 Pro。而上一個(gè)有此待遇的中國(guó)模型，是風(fēng)光無(wú)限的DeepSeekR1。

在2025年交匯的兩條“登月路線”，再度強(qiáng)調(diào)了技術(shù)紅利對(duì)一家公司的重要性。

沒(méi)有永久的王座，AI賽道頻繁上演“逆襲”

科技商業(yè)史的宏大敘事中，從來(lái)沒(méi)有永久的王座。

在“一天一變”的AI賽道，技術(shù)的迭代速度以周甚至以天為單位計(jì)算，“逆襲”和“被逆襲”的戲碼幾乎每天都在上演。

細(xì)數(shù)三年，我們經(jīng)歷了多個(gè)靠技術(shù)翻盤的時(shí)刻：OpenAI靠ChatGPT超越一眾科技大廠、月之暗面憑借長(zhǎng)文本捧紅AI助手Kimi、再是Claude系列模型反殺OpenAI，靠編程一騎絕塵、DeepSeek出圈、以Kimi K2為代表的國(guó)產(chǎn)模型在海外走紅，最近的Gemini系列翻盤。

舊王推翻新王的故事，正在OpenAI和谷歌的身上輪回。

據(jù)外媒The Information報(bào)道，本周，OpenAI CEO Sam Altman拉響紅色警報(bào)。讓這家AI獨(dú)角獸警戒的對(duì)象，正是三年前對(duì)其同樣啟動(dòng)紅色警報(bào)的谷歌。

對(duì)于谷歌來(lái)說(shuō)，2023到2024年是其最脆弱的時(shí)期。發(fā)布會(huì)上的事實(shí)性錯(cuò)誤曾讓市值一夜蒸發(fā)千億；Gemini早期的演示視頻被指責(zé)夸大宣傳；每一次試圖反擊，似乎都會(huì)被OpenAI更驚艷的產(chǎn)品搶走風(fēng)頭。

復(fù)盤兩年來(lái)的努力，Google CEOSundar Pichai一再?gòu)?qiáng)調(diào)全棧能力的重要性。

“在這個(gè)過(guò)程中，我們大幅加大了基礎(chǔ)設(shè)施投資——數(shù)據(jù)中心、TPU、GPU 等等。接下來(lái)，就是如何確保我們能把 Gemini 整合進(jìn)所有的產(chǎn)品里。”Pichai說(shuō)，“你把框架拉遠(yuǎn)一點(diǎn)看，就會(huì)覺(jué)得極度振奮。因?yàn)楫?dāng)你采用全棧方法論時(shí)，每一層的創(chuàng)新會(huì)沿著整條鏈路向上傳遞。”

谷歌正式吹響反擊的號(hào)角，始于2025年3月。

彼時(shí)，OpenAI慣用一種套路針對(duì)谷歌，即卡中其新模型的發(fā)布時(shí)間，提前一天發(fā)布自家產(chǎn)品。而這一次，谷歌“以其人之道還治其人之身”，把Gemini 2.5 Pro的發(fā)布提前到OpenAI產(chǎn)品發(fā)布的前一天。Gemini 2.5 Pro也不負(fù)眾望，在多項(xiàng)指標(biāo)上超過(guò)O3-mini，站上了最強(qiáng)模型的競(jìng)技場(chǎng)。

隨后，谷歌如同打開(kāi)了軍火庫(kù)，陸續(xù)掏出了驚艷業(yè)界的原生多模態(tài)模型VEO 3、圖片編輯模型Nano Banana，一系列超越同期競(jìng)品表現(xiàn)的產(chǎn)品接踵而至。

最終， Gemini 3 成為那個(gè)引爆 OpenAI 的關(guān)鍵產(chǎn)品。從測(cè)試結(jié)果來(lái)看，這個(gè)新模型實(shí)現(xiàn)了對(duì) GPT-5.1 的全面超越，在數(shù)學(xué)競(jìng)賽、推理、多模態(tài)等能力上超越了 Claude Sonnet 4.5 和 GPT-5.1 。

無(wú)獨(dú)有偶，這種劇情，也在月之暗面身上發(fā)生。

半年前，這家公司還處在輿論的風(fēng)暴眼中。盡管Kimi曾憑借長(zhǎng)文本脫穎而出，但隨著DeepSeek橫空出世的推理模型R1靠技術(shù)破圈，一個(gè)問(wèn)題降臨在所有AI創(chuàng)業(yè)公司身上——“為什么xx沒(méi)有成為DeepSeek？”

在此之后，月之暗面沉寂了半年時(shí)間。

看到DeepSeek后，月之暗面創(chuàng)始人楊植麟在內(nèi)部會(huì)議上給出了相當(dāng)激進(jìn)的決策：不再更新 K1系列模型，將公司核心資源押注算法和下一代模型K2的研發(fā)上。

對(duì)比谷歌，作為國(guó)內(nèi)AI創(chuàng)企，月之暗面的處境相當(dāng)嚴(yán)苛。沒(méi)有數(shù)十年的數(shù)據(jù)積累，也沒(méi)有可以和國(guó)內(nèi)外巨頭抗衡的資源，和海外AI創(chuàng)企動(dòng)輒千億美元的估值相比，月之暗面目前估值還不到40億美元，這不僅是月之暗面一家的問(wèn)題，更是國(guó)內(nèi)大模型創(chuàng)業(yè)公司的共同困境。

利用有限的資源，月之暗面在半年后，也打了一個(gè)翻身仗。

先是今年7月Kimi K2模型發(fā)布，它是當(dāng)時(shí)開(kāi)源模型中少數(shù)能達(dá)到萬(wàn)億參數(shù)的大模型，作為非思考模型，它在多項(xiàng)指標(biāo)上拿下開(kāi)源模型梯隊(duì)的SOTA。

上個(gè)月，Kimi K2 Thinking模型正式上線時(shí)，在HLE、推理、Agent等維度上超越閉源模型GPT-5和Claude Sonnet 4.5，重新回到全球開(kāi)源模型的榜首。

“這是另一個(gè)DeepSeek時(shí)刻嗎？”Kimi K2 Thinking模型發(fā)布后，Hugging Face 聯(lián)合創(chuàng)始人Thomas Wolf在X上這樣評(píng)價(jià)。

模型背后，也看到月之暗面在基礎(chǔ)技術(shù)上的追求。

比如全球首次在萬(wàn)億級(jí)別的模型預(yù)訓(xùn)練中采用二階優(yōu)化器 Muon，官方表示，Kimi K2提升了訓(xùn)練穩(wěn)定性和Token使用效率，在完成15.5T token平穩(wěn)訓(xùn)練的同時(shí)，全程無(wú)Loss Spike（損失激增）；推出下一代 Kimi Delta Attention 架構(gòu)，通過(guò)混合線性注意力機(jī)制幫助提升模型的推理效果的同時(shí)，還能降低幾倍的推理成本。

“你可能會(huì)認(rèn)為我們選擇Muon只是運(yùn)氣好，但是選擇的背后是，有幾十個(gè)優(yōu)化器和架構(gòu)沒(méi)有通過(guò)考驗(yàn)。”在月之暗面發(fā)起的AMA（Ask Me Everything）活動(dòng)上，團(tuán)隊(duì)給出了這樣的回答。

谷歌和月之暗面，也只是AI進(jìn)化的縮影。如今，AI行業(yè)遠(yuǎn)遠(yuǎn)未到逆襲的終點(diǎn)。

“當(dāng)前環(huán)境是史上最激烈的競(jìng)爭(zhēng)，唯一真正重要的是進(jìn)步速度。”DeepMind CEO Demis Hassabis說(shuō)。

AI 2.0時(shí)代，技術(shù)紅利依然是關(guān)鍵

“逆襲”還是“被逆襲”，AI 2.0時(shí)代，大模型公司們的“長(zhǎng)跑考試”還在繼續(xù)，技術(shù)依然是引領(lǐng)企業(yè)的引擎。

這與上一輪AI浪潮有著本質(zhì)的區(qū)別�；赝�2016年，當(dāng)AlphaGo點(diǎn)燃AI 1.0時(shí)代時(shí)，技術(shù)泛化問(wèn)題難以解決的情況下，行業(yè)快速觸摸到了天花板。

以計(jì)算機(jī)視覺(jué)（CV）來(lái)說(shuō)，當(dāng)時(shí)業(yè)內(nèi)面對(duì)的問(wèn)題更加棘手，比如性能非常依賴大規(guī)模標(biāo)注數(shù)據(jù)、技術(shù)泛化性差、實(shí)時(shí)處理的延遲問(wèn)題等等。在技術(shù)瓶頸的情況下，拼資源、拼生態(tài)成了創(chuàng)業(yè)公司競(jìng)爭(zhēng)的關(guān)鍵。

但AI 2.0時(shí)代完全不同。在生成式AI時(shí)代行業(yè)距離天花板尚且遙遠(yuǎn)，整個(gè)領(lǐng)域還有大量未解的問(wèn)題。

在大語(yǔ)言模型領(lǐng)域，Scaling Law（規(guī)模定律）的放緩問(wèn)題沒(méi)有得到有效解決；再看多模態(tài)大模型，包括自回歸和離散兩條技術(shù)路線還在探索中，沒(méi)有確切的答案；視頻生成的時(shí)長(zhǎng)、一致性、物理規(guī)律的學(xué)習(xí)，還有提升空間；Agent的落地，更是卡在模型泛化能力的瓶頸上。

在這個(gè)階段，如果一家公司過(guò)早放棄作為基座的模型能力提升。“地基”不穩(wěn)的情況下，很容易被后起之秀彎道超車。

2025年，回歸技術(shù)更是成為AI行業(yè)的關(guān)鍵詞。

可以看到，無(wú)論是大廠還是小廠，都在招兵買馬，集中資源攻克模型SOTA。

不僅僅是谷歌和月之暗面，最近，國(guó)內(nèi)包括字節(jié)跳動(dòng)、百度等大廠都在進(jìn)行組織架構(gòu)調(diào)整，核心邏輯是提升大模型研發(fā)的優(yōu)先級(jí)。

上月末，百度TPG組織架構(gòu)大調(diào)整，文心業(yè)務(wù)拆分為基礎(chǔ)模型和應(yīng)用模型部門，負(fù)責(zé)人直接向百度CEO李彥宏匯報(bào)；今年4月，字節(jié)AI Lab整體并入Seed團(tuán)隊(duì)，整合AI研發(fā)力量。

對(duì)技術(shù)的投入，永遠(yuǎn)是留在第一梯隊(duì)的關(guān)鍵砝碼。谷歌的路徑已經(jīng)給出了最好的示范。在Gemini 2.5 Pro的逆襲之后，同樣隸屬于Gemini家族的圖像編輯模型Nano Banana（Gemini 2.5 Flash）也快速走紅�？梢哉f(shuō)，沒(méi)有強(qiáng)大的、通用的Gemini基座在語(yǔ)言和視覺(jué)理解上的突破，谷歌難以在短時(shí)間內(nèi)拿出一個(gè)同樣具備競(jìng)爭(zhēng)力的圖像模型。

當(dāng)基礎(chǔ)模型的研發(fā)取得突破，在這個(gè)基座上，公司們能夠靠“舉一反三”，在更多領(lǐng)域拿下優(yōu)勢(shì)。

此前，月之暗面團(tuán)隊(duì)在海外社交媒體上做AMA分享時(shí)，雖然沒(méi)有具體預(yù)告K3模型的發(fā)布時(shí)間，但表示該模型有望用上他們研發(fā)的KDA（Kernel-Attention Dual Architecture）架構(gòu)。有接近月之暗面的人士對(duì)光錐智能表示，萬(wàn)億參數(shù)可以為后續(xù)的推理模型打下扎實(shí)地基，K2的多模態(tài)已經(jīng)在路上。

無(wú)論規(guī)模、體量，包括模型的性能，兩家同樣有著登月追求的公司都存在客觀差距，如同中美競(jìng)賽中那道逐漸縮小的鴻溝，東西方的技術(shù)和開(kāi)閉源之爭(zhēng)正等待著下一個(gè)奇點(diǎn)的降臨。

原文標(biāo)題 : 中美大模型“登月路”：谷歌與月之暗面的這一年