訂閱
糾錯(cuò)
加入自媒體

AI 智能體落地,北看字節(jié),南看阿里

圖片

競(jìng)爭(zhēng)深入之后,這終究是一場(chǎng)零和博弈,還是版圖互補(bǔ)?

撰文| 藍(lán)洞商業(yè) 趙衛(wèi)衛(wèi)

半個(gè)月前,騰訊集團(tuán)湯道生帶著團(tuán)隊(duì)到訪了重慶一家短劇公司麥芽傳媒;但是數(shù)日后,麥芽傳媒的 CTO 李巍登上了字節(jié)跳動(dòng)火山引擎 FORCE 原動(dòng)力大會(huì)的舞臺(tái)。

騰訊想要跟麥芽傳媒在云服務(wù)、AI 技術(shù)應(yīng)用、數(shù)字內(nèi)容聯(lián)合開發(fā)與智能分發(fā)上進(jìn)行合作,而麥芽傳媒 CTO 則公開表達(dá),明年要跟火山引擎在 AI 漫劇和 AI 真人劇、短劇 AI 審核、AI 視頻精修和播放器智能超分辨率上探索。

云廠商是短劇的「水電煤」,短劇是云廠商的「練兵場(chǎng)」,這是一種既是內(nèi)容源,又是客戶的共生關(guān)系。后知后覺的騰訊云能撬動(dòng)火山引擎的客戶嗎?

很難替代,且不說紅果短劇已經(jīng)成為行業(yè)的絕對(duì)頭部勢(shì)力,騰訊元寶在視頻模型能力上也落后同期的對(duì)手豆包和千問。

火山引擎總裁譚待在提到客戶時(shí)特意說:「影視創(chuàng)作方面用大模型的進(jìn)程比我們想象的快一些。之前想到應(yīng)該很快,沒想到能這么快,現(xiàn)在很多短劇、尤其是漫劇,還有各種 AD 素材,都在用!

有提升的模型能力,搭配解鎖的應(yīng)用場(chǎng)景,最后才能給云廠商們帶來源源不斷的新客戶。這是過去半年,豆包大模型日處理 Tokens 超過 50 萬億、增長(zhǎng) 200% 的背后邏輯。

短劇正在成為云廠商們持續(xù)解鎖的創(chuàng)新場(chǎng)景之一。不光是字節(jié)和騰訊,阿里千問 APP 也在最近上線了視頻生成模型萬相 2.6,「AI 小劇場(chǎng)」就是其中一個(gè)具體的玩法,具備音畫同步、多鏡頭生成及聲音驅(qū)動(dòng)等多種功能。

阿里和字節(jié)是國內(nèi) AI 賽道最大的競(jìng)爭(zhēng)對(duì)手,一個(gè)是 AI 云市場(chǎng)規(guī)模第一,一個(gè)是 AI 云市場(chǎng)加速度第一。

就在豆包大模型 1.8 發(fā)布之日,阿里千問 App 接入首個(gè)阿里生態(tài)場(chǎng)景高德,開始具備物理世界理解和行動(dòng)能力,更強(qiáng)的 Agent(智能體)能力是它們共同的進(jìn)化方向,它們瞄準(zhǔn)了更細(xì)分的用戶市場(chǎng)需求。

憑借各自的生態(tài)優(yōu)勢(shì)進(jìn)行全產(chǎn)業(yè)鏈的 AI 布局,這是目前阿里和字節(jié)在 AI 競(jìng)爭(zhēng)賽道中的狀態(tài),但隨著競(jìng)爭(zhēng)深入,這終究是一場(chǎng)零和博弈,還是版圖互補(bǔ)?

多模態(tài)模型能力是賽點(diǎn)

豆包大模型日均 Tokens 使用量已突破 50 萬億,這是火山引擎「秀肌肉」,而真正的「亮劍」則是推出了豆包大模型 1.8 和視頻生成模型 Seedance 1.5 Pro。

豆包大模型 1.8 的提升,主要在于給多模態(tài) Agent 場(chǎng)景進(jìn)行定向的優(yōu)化,在上下文管理,多模態(tài)理解能力上增強(qiáng),可落地到安防監(jiān)控場(chǎng)景中,提升了模型在處理復(fù)雜任務(wù)時(shí)的規(guī)劃與執(zhí)行水平。

而用戶可以在豆包和即夢(mèng) App 端體驗(yàn)到最新視頻生成模型 Seedance 1.5 Pro 的能力,它已經(jīng)實(shí)現(xiàn)音畫同步,支持多人多語言對(duì)話,能對(duì)齊口型,覆蓋四川話、粵語等中文方言、英文及小語種。

快手可靈率先在國內(nèi)視頻生成模型中取得成績(jī),2025 年預(yù)計(jì)將取得 10 億元的收入。國內(nèi)科技巨頭紛紛在這一領(lǐng)域跟進(jìn),即夢(mèng)商業(yè)化負(fù)責(zé)人杜子航在 AI 應(yīng)用分論壇說:「即夢(mèng)是全球僅次于 Sora 的創(chuàng)作平臺(tái),創(chuàng)作者超 10 萬名」。

而更重要的是他透露了一組商業(yè)化數(shù)據(jù),在即夢(mèng)的真實(shí)應(yīng)用場(chǎng)景中,占比 51% 的是專業(yè)平面設(shè)計(jì),占比 30% 的是內(nèi)容素材生產(chǎn),而 C 端社交娛樂內(nèi)容占比為 19%。也就是說,相比 C 端用戶的占比,B 端專業(yè)用戶的付費(fèi)水平已經(jīng)占比八成以上。

在底層模型 Seedance 1.5 Pro 加持下,即夢(mèng)的產(chǎn)品能力進(jìn)一步提升,包括節(jié)奏性情感表演、多樣化主體和上下文感知等,在圖片處理上也可以通過涂抹框選,進(jìn)而有強(qiáng)保持能力和精準(zhǔn)的響應(yīng)范圍,輸出影視質(zhì)感的圖片。

多模態(tài)模型能力在過去一年競(jìng)爭(zhēng)激烈,在調(diào)用量上增速很快,已經(jīng)趨同于語音模型,這成為當(dāng)下科技巨頭們競(jìng)爭(zhēng)的賽點(diǎn)。而根據(jù)杜子航介紹,面向 2026 年,即夢(mèng)將在漫劇等多個(gè)領(lǐng)域發(fā)力,包括推出多人協(xié)作的團(tuán)隊(duì)版。

再反觀阿里,最近也是在多模態(tài)模型領(lǐng)域不斷布局,最新推出的視覺生成模型萬相 2.6,集成音畫同步、多鏡頭生成及聲音驅(qū)動(dòng)等能力,單次生成視頻時(shí)長(zhǎng)達(dá)到 15 秒,并引入了「分鏡控制」與「角色扮演」功能,背后核心還是要追求專業(yè)影視制作和圖像創(chuàng)作場(chǎng)景的市場(chǎng)空間。

從模型到應(yīng)用,從硬件到產(chǎn)品,阿里最近在 AI 領(lǐng)域「擰油門」的狀態(tài)就沒有停過。

上線千問 APP 后,發(fā)布夸克 AI 眼鏡,又成立千問 C 端事業(yè)群,而螞蟻也在通過「靈光」應(yīng)用和「螞蟻阿!沟犬a(chǎn)品在健康等細(xì)分賽道進(jìn)行拓展,密集曝光之后,「螞蟻阿!挂欢葲_進(jìn)蘋果應(yīng)用商店免費(fèi)榜第三位。

如今在模型能力上都能實(shí)現(xiàn)「音畫同步」,但阿里萬相 2.6 和豆包 Seedance 1.5 Pro 差距有多大?這顯然還需要時(shí)間和市場(chǎng)驗(yàn)證,火山引擎總裁譚待在提到這一功能時(shí)明確說,「Seedance 1.5 Pro 實(shí)現(xiàn)音畫同步,在行業(yè)不算首創(chuàng),但同行功能做了,不代表做好了!

放在更大的背景中看,字節(jié)和阿里在多模態(tài)模型能力上的競(jìng)逐,一方面是對(duì) B 端企業(yè)客戶增長(zhǎng)市場(chǎng)的必然追求,而另外一方面也是補(bǔ)齊跟國際同行的差距。

視頻生成能夠?qū)崿F(xiàn)音畫同步這一功能,是谷歌在今年 5 月份率先在 Veo3 上實(shí)現(xiàn)的,這給整個(gè)視頻模型行業(yè)帶來與之看齊的方向,讓 AI 視頻走出「默片時(shí)代」,指令遵循更好、保真度更高。

而在落地場(chǎng)景中,谷歌云業(yè)務(wù)也給全世界的同行們做出了示范。谷歌云憑借多模態(tài)的模型能力,先后拿下了英國廣告公司 WPP 集團(tuán)、維珍郵輪等多個(gè)企業(yè)級(jí)大客戶,通過 Agent 融入客戶公司業(yè)務(wù),推動(dòng)這些大企業(yè) AI 營銷平臺(tái)加速人工智能轉(zhuǎn)型,已經(jīng)在國際市場(chǎng)中展開更大的圈地運(yùn)動(dòng)。

一場(chǎng)生態(tài)位與話語權(quán)的變革

對(duì)于 AI 云服務(wù)的客戶們來說,能不能用 AI 模型能力和智能體應(yīng)用重塑生產(chǎn)力,帶來真切的降本增效,才是選擇的最大標(biāo)準(zhǔn),因?yàn)榧夹g(shù)只是表面的護(hù)城河,而 ROI(投資回報(bào)率)才是真正的尺子。

而當(dāng) Agent 開始落地企業(yè)真實(shí)的場(chǎng)景中,安全性的保證是第一位的,而后才是效率的提升,誰能率先解決復(fù)雜任務(wù)的穩(wěn)定性,誰才能通過客戶的最終判斷。

「第一款產(chǎn)品從 0 賣到 30 萬臺(tái)用了 250 天,而在火山引擎的支持下,第二代端到端語音模型的AI玩具賣到 30 萬臺(tái),只用了 25 天,速度提升了 10 倍」,躍然創(chuàng)新(Haivivi)聯(lián)合創(chuàng)始人高峰在火山引擎FORCE 原動(dòng)力大會(huì)上說。

躍然創(chuàng)新是一家 AI 玩具公司,今年 8 月發(fā)布了第二代產(chǎn)品 CocoMate 系列,這是搭載端到端語音模型的 AI 玩具。第二代產(chǎn)品的能力顯著提升,主要是因?yàn)榛鹕揭娑拱鼘?shí)時(shí)語音模型的支持,CocoMate 能識(shí)別語氣、理解情緒,支持主動(dòng)接話并隨時(shí)被打斷,響應(yīng)速度壓縮到 1 秒以內(nèi),而且可以在噪音環(huán)境中使用。

在模型能力的提升下,AI 玩具行業(yè)成為創(chuàng)造新需求的品類整體迎來了大發(fā)展。2026 年1 月,躍然創(chuàng)新還將發(fā)布第三代 AI 玩具,這是一款?yuàn)W特曼 AI 互動(dòng)對(duì)話器,用戶可以與奧特曼 AI 角色進(jìn)行對(duì)話,還支持無限距離組隊(duì)對(duì)講等功能。

而在當(dāng)下 AI 落地真實(shí)場(chǎng)景 Agent 為王的行業(yè)共識(shí)中,阿里和字節(jié)出現(xiàn)了哪些新需求新變化?

阿里 AI 的核心關(guān)鍵詞,是體內(nèi)循環(huán)的「一統(tǒng)」,讓 C 端的需求匯集到一處。

不論是成立千問事業(yè)群,還是把千問打造成一款超級(jí) App,本質(zhì)都是要把阿里計(jì)劃將地圖、外賣、訂票、辦公、學(xué)習(xí)、購物、健康等各類生活場(chǎng)景接入千問,讓其能通過 Agent 形式外鏈淘寶電商等細(xì)分場(chǎng)景中,讓不同的需求對(duì)齊到一起。

比如高德此前有 AI 導(dǎo)航智能體,后來有直接對(duì)話的出行生活智能體「小高老師」,這都是存在于高德 App 內(nèi)的核心交互模式,而接入了千問之后,在千問 App 內(nèi)就可以實(shí)現(xiàn)基于高德的服務(wù)。

而字節(jié)的 AI 核心策略是體外循環(huán)的「下沉」,讓 B 端客戶的 AI 使用門檻更低。

在推出智能體統(tǒng)一交互入口 AgentSphere 時(shí),火山引擎副總裁提到一個(gè)顛覆他認(rèn)知的事情,那就是很多企業(yè)中的智能體不是太少,而是太多太散了,這也是造成 AI 低效的一個(gè)重要原因。所以無數(shù)個(gè)數(shù)字員工或是智能體,都將在AgentSphere 得到統(tǒng)一的交互,需求不同的用戶看到不同的定制看板,而不是千篇一律的對(duì)話框。

而為了降低用戶使用門檻,豆包還拿出了豆包助手 API,讓企業(yè)通過 API 開箱即用。也就是說,火山引擎為了下沉,賣的不光是模型,更是封裝好的成熟產(chǎn)品體驗(yàn)。

參照谷歌 Gemini 3.0 帶給對(duì)手 OpenAI 的壓力,不光是因?yàn)楣雀枳C明了 AI 大模型的能力上升有極大的上限,另外一方面也證明了 AI 落地到公司具體業(yè)務(wù)中,能把搜索、廣告和 Youtube 等多個(gè)業(yè)務(wù)生態(tài)串聯(lián)起來,真正帶來業(yè)務(wù)效率的提升,給市場(chǎng)看到了真正 AI 落地可能性。

從谷歌給中國同行帶來的啟示看,懂用戶、更好用的 AI 產(chǎn)品很重要,但更重要的是 AI 能力如何準(zhǔn)確服務(wù)當(dāng)下的用戶群體,這是一場(chǎng)技術(shù)變現(xiàn)效率的比拼,更是一場(chǎng)生態(tài)位與話語權(quán)的變革。

無論是豆包通過流量入口優(yōu)勢(shì)挖掘 B 端客戶,還是阿里通過 B 端服務(wù)能力進(jìn)入 C 端市場(chǎng),本質(zhì)上都是通過各自的優(yōu)勢(shì)地位進(jìn)行 AI 全產(chǎn)業(yè)鏈的布局,各自的路徑已經(jīng)越來越清晰,現(xiàn)在階段只是版圖互補(bǔ),而不遠(yuǎn)的未來可能就是一場(chǎng)零和博弈。

       原文標(biāo)題 : AI 智能體落地,北看字節(jié),南看阿里

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)