訂閱
糾錯
加入自媒體

AI新王與舊王:一場圍繞著數(shù)據(jù)飛輪的戰(zhàn)爭

圖片

誰能更快轉(zhuǎn)動那個飛輪?

文|徐鑫

編|任曉漁

時隔三年,大反轉(zhuǎn)。

上周一,OpenAI CEO山姆·奧特曼在內(nèi)部宣布啟動“紅色代碼”行動,推遲其他一切產(chǎn)品開發(fā)專注ChatGPT,以應(yīng)對來自谷歌和其他對手的沖擊。三年前此時,ChatGPT剛問世,拉響紅色警報的是谷歌這家老牌人工智能巨擘。

攻守易勢,恰恰映射出AI競爭當(dāng)下進(jìn)入的新周期。

OpenAI拉響警報,在于這些大模型賽道的開啟者,突然發(fā)現(xiàn)自己通過不斷定義新戰(zhàn)場,圈用戶建生態(tài)形成的領(lǐng)先優(yōu)勢,正被人工智能舊王谷歌所逐漸侵蝕。

拉長時間線看,相比OpenAI這類在算法層面奪得先聲的公司,谷歌擁有的場景和生態(tài)能力當(dāng)下在拉鋸戰(zhàn)里占據(jù)主動。場景-數(shù)據(jù)與大模型轉(zhuǎn)動起來的效果超出了OpenAI的預(yù)期。

在國內(nèi),同樣的情形也在上演?伸`憑借著快手在APP時代的數(shù)據(jù)沉淀和場景快速從視頻生成賽道脫穎而出,而快手又為可靈健康造血以及模型迭代提供了閉環(huán)場景。群核科技憑借著應(yīng)用時代積累的海量物理正確的三維數(shù)據(jù),在空間智能時代在全球嶄露頭角。甚至最近大火的豆包手機,也讓許多人意識到APP場景、數(shù)據(jù)在AI時代也關(guān)乎大模型能力閉環(huán)。

國內(nèi)外無論是AI原生玩家還是老牌巨頭,都在紛紛加速基于場景,構(gòu)建從數(shù)據(jù)-模型到生態(tài)能力的閉環(huán)。

而那些能在競爭里將“場景理解”有效轉(zhuǎn)化為“智能理解”的企業(yè),有望率先定義AI戰(zhàn)爭的下一章。

01

紅色警報背后,新王是舊王?

時隔三年,硅谷再次響起了紅色警報。

8月問世的Nano Banana以刷屏級表現(xiàn)驅(qū)動了Gemini的用戶規(guī)模增長。9月13日,Gemini成功登頂美國地區(qū)AppStore免費榜總榜,并于同日在其他77個國家和地區(qū)免費榜位居第一。

圖片

11月谷歌在官方博客中提及Gemini月活躍用戶突破6.5億,這個數(shù)字較7月谷歌財報發(fā)布時公布的4.5億月活用戶(相比此前季度50%增長)再出現(xiàn)大幅增長,顯著縮小了與ChatGPT的8億月活差距。

人工智能之父Hinton日前對BusssinessInsider鮮明表達(dá)了對這場戰(zhàn)爭的態(tài)度,他甚至驚訝于谷歌到現(xiàn)在才翻身,“谷歌制造自己的芯片,有很多非常優(yōu)秀的研究員,顯然還有大量數(shù)據(jù)和數(shù)據(jù)中心”,因此谷歌會贏得戰(zhàn)爭。

一位AI行業(yè)資深人士告訴數(shù)智前線,場景和數(shù)據(jù)優(yōu)勢在當(dāng)下的智能競爭中是很重要的一環(huán)。谷歌此前的應(yīng)用場景里沉淀了大量用戶搜索意圖數(shù)據(jù),天然適配強化學(xué)習(xí)技術(shù)。用戶基于搜索的結(jié)果會有行為反饋,比如十個結(jié)果會點幾下,這種“決策-結(jié)果-反饋”,完美適配RLHF/RLAIF。在Scaling Law越來越重視后訓(xùn)練強化學(xué)習(xí)的背景下,它對模型智能至關(guān)重要。

可以說,AI戰(zhàn)爭,已經(jīng)不再是單一維度的模型參數(shù)規(guī)模的競爭,應(yīng)用時代的積累的生態(tài)與分發(fā)優(yōu)勢、技術(shù)與數(shù)據(jù)的閉環(huán),產(chǎn)品協(xié)同與場景落地,都左右著局勢。

無獨有偶,國內(nèi)戰(zhàn)場,同樣的情形也在上演。

無論是千問期望協(xié)同阿里體系內(nèi)高德、閃購等生態(tài)力量,打造一個會辦事的AIToC入口,還是豆包手機的Agent奇襲手機APP引發(fā)一眾超級應(yīng)用彈壓,都顯示出,AI時代的硝煙與上一個時代的戰(zhàn)局有著千絲萬縷的聯(lián)系。

實際上,視頻生成領(lǐng)域去年已經(jīng)上演過類似的腳本。

去年2月Sora的Demo視頻讓生成的人物、場景第一次真正地動了起來,而不再是有動效的圖片,OpenAI很自然地成了賽道的定義者。

之后的幾個月里,海內(nèi)外各路玩家及新興創(chuàng)業(yè)團隊紛紛推出視頻生成類產(chǎn)品。去年6月,快手加入賽道,第一次凸顯出了場景和數(shù)據(jù)優(yōu)勢對戰(zhàn)局的影響。

不同于當(dāng)時Sora是期貨,可靈能真正試用,且效果經(jīng)驗,生成時長還達(dá)到分鐘級,這種節(jié)奏超過了原先的賽道定義者OpenAI?焓止俜浇衲8月在財報發(fā)布會上提到,可靈AI單季度收入突破2.5億元。

圖片

與之對比,OpenAI的Sora1去年12月才上線,Sora2今年9月30日上線,推出后雖然收獲了一大票稱贊,但這位曾經(jīng)的市場教育者要從“玩具”進(jìn)化成“工具”挑戰(zhàn)重重——最近a16z合伙人Olivia Moore展示了一張APP數(shù)據(jù)監(jiān)測服務(wù)商Sensor Tower的截圖顯示,Sora的30天用戶留存率1%,60天用戶留存率接近0%。

擁有場景和應(yīng)用生態(tài)在AI時代的價值由此可見一斑。快手此前并不算AI第一梯隊玩家,但基于APP時代海量的場景沉淀和數(shù)據(jù)積累,快手沿襲Sora探出來的路,成功打造了一款有全球影響力的產(chǎn)品。

這也讓很多分析人士看到,中國過去十余年數(shù)字經(jīng)濟發(fā)展所沉淀下來的多元,豐富的場景及數(shù)據(jù)優(yōu)勢在當(dāng)下AI競爭里的價值和意義。同時,一些人認(rèn)為,應(yīng)該重估那些上一個應(yīng)用時代拼出來的場景和數(shù)據(jù)的價值。

不過,這當(dāng)然并不意味著僅憑數(shù)據(jù)和場景就能自動贏得戰(zhàn)爭。局勢的真實情況就像谷歌和OpenAI的位置輪替一樣,基模更迭如同出回合制決斗,各方都在加速補課,看誰能更快轉(zhuǎn)動那個飛輪。

是AI原生玩家們基于AI原生能力穿透用戶心智,構(gòu)建出用戶與AI迭代的閉環(huán),還是上一個時代的老炮們依托場景數(shù)據(jù)積累,快速將場景和數(shù)據(jù)優(yōu)勢轉(zhuǎn)換成模型優(yōu)勢,比拼的還是決心、敏捷和執(zhí)行力。

一場圍繞著數(shù)據(jù)飛輪的纏斗已經(jīng)打響。

02

空間智能,呼喚智能飛輪

作為AI發(fā)展演進(jìn)的前沿賽道以及人工智能的下半場,空間智能領(lǐng)域里同樣的邏輯正在復(fù)現(xiàn)——場景、數(shù)據(jù)和智能能否形成迭代閉環(huán),正關(guān)乎行業(yè)能否加速從實驗室走向產(chǎn)業(yè)規(guī)模落地。

一位行業(yè)資深人士告訴數(shù)智前線,目前整個空間智能領(lǐng)域可以類比為大語言模型的GPT-2階段。在這一階段里,技術(shù)路線激烈碰撞,基礎(chǔ)能力還在積累,行業(yè)的Scaling Law仍待發(fā)現(xiàn)。

全行業(yè)需要努力實現(xiàn)技術(shù)路線收斂,同時破解高質(zhì)量大規(guī)模的3D數(shù)據(jù)稀缺瓶頸,基于場景加速數(shù)據(jù)-模型迭代,才能推動空間智能的涌現(xiàn)。

用更直白的話說,整個行業(yè)都在呼喚著空間智能領(lǐng)域能構(gòu)建起一個數(shù)據(jù)飛輪。

行業(yè)內(nèi)玩家正從不同層面來加速這一進(jìn)程。

比如人工智能教母李飛飛的世界模型Marble、GoogleDeepMind推出的世界模型Genie3、Meta的三維重建模型SAM3D和國內(nèi)的騰訊混元3D世界模型以及英偉達(dá)的Cosmos世界基礎(chǔ)模型(WFM)等,它們的能力涉及到空間的重建、生成、推理、交互等多個層面。

但作為一個還處在發(fā)展早期的領(lǐng)域,這些不同層面的能力很少在一個體系內(nèi)能讓人真正廣泛地用起來。這無疑不利于整個行業(yè)內(nèi)構(gòu)建數(shù)據(jù)飛輪,實現(xiàn)技術(shù)落地。

而國內(nèi)最早做物理世界模擬的群核科技率先做了一個決定:將14年來沉淀的底層空間能力匯聚在自己的Aholo空間智能開放平臺,全面開放給行業(yè)。其中包括其模型層和工具層的空間重建、空間生成、空間編輯與空間理解在內(nèi)的能力,將以API/SDK的形式逐步對外開放。

圖片

空間重建借助3DGS技術(shù)能夠快速1:1復(fù)制物理世界到數(shù)字世界?臻g生成則是從0到1創(chuàng)造3D空間,幾句話描述或者給模型一張照片,模型就能生成三維場景。今年國內(nèi)外空間生成模型動態(tài)頻頻,是空間智能領(lǐng)域“新王們”的一個核心押注方向?臻g編輯解決了當(dāng)下AIGC無法二次編輯調(diào)整的痛點,讓AI生成的空間內(nèi)容不再是“黑箱產(chǎn)物”?臻g理解則是包括具身智能等智能體看懂眼前物理世界的基本能力。

外界看來,這四重能力集中在一個平臺,其實有助于加速行業(yè)推進(jìn)空間智能的應(yīng)用和落地進(jìn)程,加速基于場景數(shù)據(jù)-應(yīng)用反饋與迭代的閉環(huán)。

原來重建工作主要靠CAD圖紙等去做一些數(shù)字化,真實世界數(shù)據(jù)與數(shù)字世界數(shù)據(jù)之間有GAP。而3DGS技術(shù)和空間生成能力協(xié)同,相當(dāng)于打開了內(nèi)容的新的源頭,打破了過往高質(zhì)量3D數(shù)據(jù)的瓶頸。

“源頭打開了,才會有人把內(nèi)容導(dǎo)入到工具平臺,用戶才會進(jìn)來完成后面的編輯跟推理工作”,一位行業(yè)資深人士指出。

空間編輯可以視作數(shù)據(jù)優(yōu)化與交互界面。此前群核就已通過酷家樂等產(chǎn)品載體將之用在空間設(shè)計、電商3DAI設(shè)計、工業(yè)柔性制造等場景中。

現(xiàn)在進(jìn)一步對外開放,隨著更多數(shù)據(jù)導(dǎo)入,有了編輯工具就像語言模型的多輪對話能更好校準(zhǔn)用戶需求提升回答準(zhǔn)確性一樣,專業(yè)人士借助工具鏈去做更加深度編輯。比如把商品放入到構(gòu)建好的數(shù)字空間里,設(shè)計師能自由編輯,產(chǎn)出更符合個性需求的高品質(zhì)內(nèi)容物料。

“市場才剛剛開始,談不上競爭。行業(yè)當(dāng)下最需要的是底層技術(shù)的‘賣水人’,我們希望空間智能能夠更快向前。”群核科技董事長黃曉煌在媒體溝通環(huán)節(jié)告訴數(shù)智前線。

隨著算力的提升,當(dāng)下無論是空間設(shè)計、XR、影視短劇、文化遺產(chǎn)保護(hù)等3D內(nèi)容創(chuàng)作領(lǐng)域,還是工業(yè)數(shù)字孿生、機器人仿真訓(xùn)練等對3D結(jié)構(gòu)化數(shù)據(jù)有高要求的場景,對高質(zhì)量、可交互、可計算的3D場景和數(shù)據(jù)的需求都在急劇攀升。

那些能夠把物理世界和數(shù)字世界更好連接起來的技術(shù)能夠開放出來,無疑對行業(yè)早期是一個巨大的驅(qū)動。

03

一家公司的飛輪和中國AI的飛輪

而對群核這家公司來說,隨著越來越多用戶使用,反饋沉淀,其自身的數(shù)據(jù)飛輪正在增強。

這家從空間設(shè)計軟件起家的公司,現(xiàn)在已經(jīng)是全球最大的空間設(shè)計平臺。群核有著全球最多元龐大的空間場景沉淀,并且,由于空間設(shè)計最終都要真實落地,讓其沉淀的數(shù)據(jù)具備了獨特的物理正確屬性,符合物理規(guī)律。在空間智能時代,這些都成為了構(gòu)建強大空間智能模型的燃料。今年它也正式推出了業(yè)界首個專注于3D室內(nèi)場景認(rèn)知與生成的空間大模型?梢哉f,群核自身已經(jīng)形成了一個正向循環(huán)的飛輪。

空間編輯工具帶來了空間場景和數(shù)據(jù)的沉淀,海量的數(shù)據(jù)加速了空間大模型迭代。而隨著此次更多的能力對外開放,群核完成了數(shù)據(jù)-大模型-工具能力的全鏈路開放,這家公司又有機會獲得更豐富更開放多維的場景和數(shù)據(jù)沉淀,真正成為一個空間智能的基礎(chǔ)設(shè)施平臺。正向循環(huán)的數(shù)據(jù)飛輪有望更加速運轉(zhuǎn)。

圖片

目前在一些場景里,群核已經(jīng)與一些合作伙伴探索測試基于Aholo平臺四項能力在同一個工作流去應(yīng)用落地。比如工廠數(shù)字孿生和仿真場景,一些成熟的工廠需要引入智能化設(shè)備。基于群核這套能力去做模擬仿真,可以大大降低不合理設(shè)計帶來的成本浪費。

另一方面,從數(shù)據(jù)到模型到底層能力的全面開放,對群核而言,也意味著從3D空間軟件提供商走向了空間智能服務(wù)提供商。

黃曉煌提到,空間智能此前更多是群核內(nèi)生的能力,之所以通過Aholo平臺開放出來,是因為他們認(rèn)知到時代在發(fā)生變化。能力開放后滾動而來的新的數(shù)據(jù)和能力進(jìn)一步讓群核的應(yīng)用有了迭代。

他們剛剛發(fā)布的3D AI內(nèi)容創(chuàng)作工具LuxReal就是一個代表。通過空間大模型和工具的相互補充,LuxReal或許能夠補足現(xiàn)有視頻生成模型時空不一致和不可控的問題。這或許是全球第一個3D 視頻生成Agent。

“今年以來包括Deepseek在內(nèi)的一批公司都一開始就把底層能力暴露出來,大家有一種一起推動行業(yè)往前走的勢頭,我們也順勢而為。”他認(rèn)為,空間智能正處于發(fā)展早期階段,基于開放的平臺,整個行業(yè)能一起解決問題,突破技術(shù)瓶頸。

外界觀察來看,這可能也是當(dāng)下新一批中國公司開放創(chuàng)新浪潮的一個縮影。中國創(chuàng)新企業(yè)正進(jìn)入新的階段,既能參與最前沿賽道最前沿戰(zhàn)場的創(chuàng)新,也以開放和共享的姿態(tài),有成為行業(yè)基礎(chǔ)設(shè)施的能力和意愿。

這種角色變化里其實也能窺見中國企業(yè)在人工智能時代里的一種可能的成長路徑。

以群核和快手這批企業(yè)為例,過往在應(yīng)用時代,基于場景沉淀出數(shù)據(jù),今天正在成為推進(jìn)AI發(fā)展的重要燃料,它進(jìn)一步帶動了企業(yè)在新興賽道智能飛輪的形成?梢哉f,應(yīng)用優(yōu)勢,在全新的人工智能時代仍有回響。

中國整體在移動互聯(lián)網(wǎng)時代強大的應(yīng)用場景和海量數(shù)據(jù)積累,能否推動中國AI更快構(gòu)建這種場景-數(shù)據(jù)和智能的飛輪,實現(xiàn)從場景到智能的躍遷?從這個意義上看,當(dāng)下中國AI也需要加速構(gòu)建這一輪智能飛輪。

       原文標(biāo)題 : AI新王與舊王:一場圍繞著數(shù)據(jù)飛輪的戰(zhàn)爭

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號