AI 最先征服的是屏幕,最難進(jìn)入的是現(xiàn)實(shí)世界。在屏幕里,AI 犯錯(cuò)最多是答錯(cuò)一道題、寫壞一段代碼;到了現(xiàn)實(shí)世界,一旦出錯(cuò),就會(huì)撞上車、人和道路。
過去三年,大語言模型、AI 編程和 Agent 平臺(tái)擠進(jìn)同一片數(shù)字戰(zhàn)場(chǎng),模型能力、價(jià)格和分發(fā)渠道都在快速內(nèi)卷。但當(dāng)黃仁勛在 CES 2026 上宣告機(jī)器人領(lǐng)域的 ChatGPT 時(shí)刻已經(jīng)到來,把 " 物理 AI" 推到行業(yè)聚光燈中心的時(shí)候,一個(gè)新的問題浮出水面,從屏幕里走出來的 AI,要如何在真實(shí)的物理世界里站住腳?在黃仁勛的描述中,物理 AI 的核心在于讓 AI 理解真實(shí)世界,并據(jù)此進(jìn)行推理和規(guī)劃行動(dòng)。
同期,英偉達(dá)也在把 Physical AI 推向基礎(chǔ)設(shè)施層面,Cosmos 用于世界模型和合成數(shù)據(jù),GR00T 面向機(jī)器人學(xué)習(xí)與推理,Isaac Lab-Arena 用于評(píng)估,OSMO 則打通從邊緣到云端的訓(xùn)練流程。它傳遞出的意思很明確,AI 走進(jìn)物理世界,不只是模型能力問題,也是一整套仿真、訓(xùn)練、驗(yàn)證和部署基礎(chǔ)設(shè)施的問題。
資本率先給出了回應(yīng)。具身智能成了 2026 年最火熱的賽道,融資額一路飆升,百億估值的公司接連涌現(xiàn)。但熱鬧背后有一個(gè)更根本的問題,物理 AI 的門檻不在于誰喊概念更響、誰融資更多,而在于誰先拿到進(jìn)入長(zhǎng)賽道的 " 門票 ",即規(guī)?;瘮?shù)據(jù)、可持續(xù)現(xiàn)金流,以及真實(shí)世界里的量產(chǎn)驗(yàn)證。
物理 AI 不是一條單線賽道。具身智能、自動(dòng)駕駛、工業(yè)機(jī)器人、邊緣 AI,都在把 AI 從屏幕帶進(jìn)現(xiàn)實(shí)世界,它們之間也并非對(duì)立關(guān)系,更像是物理 AI 走向現(xiàn)實(shí)的不同入口,只是節(jié)奏各異。從今天的真實(shí)世界數(shù)據(jù)、現(xiàn)金流和量產(chǎn)驗(yàn)證看,自動(dòng)駕駛可能是更早接近閉環(huán)的一支。

為什么是自動(dòng)駕駛
為什么物理 AI 沒有像 ChatGPT 那樣迅速爆發(fā)?一個(gè)被反復(fù)討論的原因是成本結(jié)構(gòu)。數(shù)字 AI 的數(shù)據(jù)來自互聯(lián)網(wǎng),天然大規(guī)模、低成本、易獲取,驗(yàn)證也便宜,Agent 調(diào)用一個(gè)工具只需要一個(gè) API 接口。物理世界的邏輯完全不同,數(shù)據(jù)采集難,測(cè)試周期長(zhǎng),試錯(cuò)代價(jià)高。OpenAI 早年同時(shí)布局機(jī)器人和語言模型,最終階段性選擇 GPT,背后正是這種成本結(jié)構(gòu)差異。
但物理世界 " 可能是更大的一部分 "。這是 Momenta CEO 曹旭東在北京車展期間反復(fù)提到的一個(gè)判斷。在他看來,自動(dòng)駕駛是最先規(guī)?;芡?" 數(shù)據(jù)閉環(huán) " 和 " 商業(yè)閉環(huán) " 的物理 AI 場(chǎng)景。體驗(yàn)提升帶來商業(yè)化,商業(yè)化帶來數(shù)據(jù)回流,數(shù)據(jù)再推動(dòng)模型能力躍升,一旦這個(gè)循環(huán)轉(zhuǎn)起來,進(jìn)步的速度會(huì)遠(yuǎn)超直覺。他分享過一個(gè)觀察," 任何一個(gè)人工智能應(yīng)用,一旦接近人類的水平,就會(huì)在很短的時(shí)間內(nèi)大幅超過人類的水平。" 前面可能花十年、二十年爬坡,但超越人可能就發(fā)生在一兩年內(nèi)。
從這個(gè)角度看,搭載 Momenta 系統(tǒng)的量產(chǎn)車輛規(guī)模超過 80 萬臺(tái),意味著 Momenta 已經(jīng)是少數(shù)成功在真實(shí)世界中積累物理 AI 數(shù)據(jù)、工程經(jīng)驗(yàn)和商業(yè)閉環(huán)的公司之一。曹旭東認(rèn)為,智駕領(lǐng)域正在呈現(xiàn)一種 " 摩爾定律 " 式的進(jìn)步節(jié)奏,過去大約是兩年十倍的提升速度,行業(yè)領(lǐng)軍企業(yè)甚至可能做到一年十倍。

在模型里的世界先練車
" 世界模型 " 正在成為自動(dòng)駕駛行業(yè)越來越重要的關(guān)鍵詞。
2026 年 2 月,Waymo 發(fā)布了基于 Google DeepMind Genie 3 構(gòu)建的 Waymo World Model,用于生成高真實(shí)度、可交互的自動(dòng)駕駛仿真環(huán)境,尤其覆蓋現(xiàn)實(shí)中難以大規(guī)模采集的長(zhǎng)尾場(chǎng)景。Momenta R7 也處在這一大方向上,只是它強(qiáng)調(diào)的是強(qiáng)化學(xué)習(xí)世界模型的量產(chǎn)首發(fā)。這說明,世界模型不再只是自動(dòng)駕駛論文里的概念,而是正在變成頭部玩家處理長(zhǎng)尾風(fēng)險(xiǎn)和仿真訓(xùn)練的共同語言。

一個(gè)具體的例子,如果前車意外掉落一箱蘋果,R7 能預(yù)判蘋果滾落的軌跡與擴(kuò)散范圍,提前平穩(wěn)減速并規(guī)劃繞行路線。只依賴已有數(shù)據(jù)分布和真實(shí)路測(cè),很難窮盡這類低頻風(fēng)險(xiǎn)。世界模型正在把長(zhǎng)尾問題從 " 碰巧遇到 " 轉(zhuǎn)向 " 可推演、可訓(xùn)練 "。當(dāng)然,這不意味著系統(tǒng)已經(jīng)窮盡了所有極端風(fēng)險(xiǎn),但方向已經(jīng)明確。不過,世界模型也并不意味著可以繞開真實(shí)道路。仿真可以擴(kuò)大長(zhǎng)尾場(chǎng)景覆蓋,卻無法完全復(fù)制真實(shí)世界的不確定性,最終仍需要真實(shí)驗(yàn)證。這也解釋了為什么 " 量產(chǎn) " 和 " 真實(shí)道路閉環(huán) " 在物理 AI 里如此重要。

物理 AI 的門檻
資本熱不是問題,物理 AI 本來就需要長(zhǎng)期資金。另據(jù)公開統(tǒng)計(jì)顯示,2026 年前幾個(gè)月,中國(guó)具身智能融資已進(jìn)入百億級(jí)密集爆發(fā)階段。但資本只能更快地為試錯(cuò)掃清障礙,卻買不來完整的物理世界周期。安全驗(yàn)證、供應(yīng)鏈適配、車規(guī)級(jí)測(cè)試、功能安全認(rèn)證,每一個(gè)環(huán)節(jié)都會(huì)把速度重新拉慢。
曹旭東給出了一個(gè)更量化的判斷,物理 AI 需要一張 " 門票 ",這張門票的本質(zhì)是能夠長(zhǎng)期支撐研發(fā)的現(xiàn)金流業(yè)務(wù)。實(shí)現(xiàn)規(guī)?;?L4 自動(dòng)駕駛,累計(jì)投入至少需要百億美元級(jí);通用機(jī)器人可能進(jìn)一步上升到幾百億甚至千億美元級(jí)。單靠融資,長(zhǎng)期看并不現(xiàn)實(shí)。
時(shí)間壁壘同樣真實(shí)。自動(dòng)駕駛軟件具備接近零邊際成本的規(guī)模效應(yīng),先發(fā)優(yōu)勢(shì)因此格外顯著。以奔馳為例,2017 年投資 Momenta,是由奔馳董事長(zhǎng)康林松親自決策,但第一個(gè)量產(chǎn)項(xiàng)目上市是 2025 年下半年,整整八年。國(guó)際 OEM 的合作周期是五到七年,國(guó)內(nèi)也要三年。而德系豪華所代表的全球最嚴(yán)苛標(biāo)準(zhǔn),甚至需要更長(zhǎng)時(shí)間,有時(shí)要長(zhǎng)達(dá)十年。但一旦成功拿下,就有望迎來 " 贏者通吃 " 的局面,實(shí)現(xiàn) " 馬太效應(yīng) "。
這種技術(shù)和產(chǎn)業(yè)規(guī)模上的先發(fā)優(yōu)勢(shì)也會(huì)體現(xiàn)在對(duì)資本市場(chǎng)資源的更可持續(xù)的使用上,更加接近終局的公司在快速進(jìn)入更成熟的資源池。
據(jù)媒體報(bào)道,Momenta 已向港交所秘密遞交招股書,IPO 估值預(yù)期超千億元,計(jì)劃年內(nèi)掛牌。2024 年下半年曾啟動(dòng) Pre-IPO 融資,交割金額超 10 億美元。
真正的測(cè)試場(chǎng)
如果說門票理論是一種行業(yè)推演,那么 BBA 的選擇就是一種現(xiàn)實(shí)驗(yàn)證。
按 Momenta 披露,本屆北京車展有超過 20 個(gè)品牌、60 余款車型搭載其方案,其中包括梅賽德斯 - 奔馳、奧迪、寶馬的新發(fā)布車型。這組客戶的意義不在于名單本身,而在于它們代表了全球汽車工業(yè)里門檻最高、最重視安全冗余的一批需求。能夠進(jìn)入這些品牌的量產(chǎn)體系,本身就是對(duì)一家 AI 公司技術(shù)成熟度和工程交付能力的高強(qiáng)度檢驗(yàn)。
奧迪 AUDI 品牌產(chǎn)品研發(fā)執(zhí)行副總裁 Martin Kraus 在北京車展的一場(chǎng)圓桌中說了一句很直白的話," 質(zhì)量和安全標(biāo)準(zhǔn)是沒得商量的。" 按他的說法,E7X 將成為奧迪家族全球范圍內(nèi)第一款搭載 L3 級(jí)自動(dòng)駕駛系統(tǒng)的車型,也將是 Momenta 首款搭載 L3 系統(tǒng)的量產(chǎn)車型。

圓桌上,一位奧迪車主講起京滬高速上的一次經(jīng)歷,前車連續(xù)追尾,系統(tǒng)幫他剎住并駛離超車道。他給母親打電話," 你幫我把湯熱一下,我要到家了。"
這比任何參數(shù)都更能解釋安全標(biāo)準(zhǔn)的意義,它最后要回答的,是一個(gè)人能不能安全回家。
梅賽德斯 - 奔馳中國(guó)研發(fā)自動(dòng)駕駛及車聯(lián)網(wǎng)執(zhí)行副總裁王忻在同一場(chǎng)圓桌中提到,AI 進(jìn)入物理世界時(shí)," 這個(gè)虛擬人也需要有情感,它也要有‘害怕’ "。物理 AI 如果只理解物理規(guī)律,還不夠,它最后要理解的是坐在車?yán)锏娜巳绾胃械桨踩蛷娜荨?/p>
對(duì)中國(guó) AI 公司來說,真正的全球競(jìng)爭(zhēng)力不只是速度和成本,還要能進(jìn)入全球汽車工業(yè)最復(fù)雜、也最難妥協(xié)的量產(chǎn)體系。
從行業(yè)視角看,Momenta 這樣的公司在今天的物理 AI 版圖里占據(jù)了一個(gè)特殊位置。它并不只是做一套智駕系統(tǒng),而是在真實(shí)道路上積累物理 AI 所需的底層能力,包括數(shù)據(jù)閉環(huán)、世界模型訓(xùn)練、仿真驗(yàn)證、車規(guī)級(jí)安全和量產(chǎn)交付。今天這些能力服務(wù)于智能駕駛,未來也可能外溢到 Robotaxi、物流、低速無人車,甚至更廣義的具身智能場(chǎng)景。
自動(dòng)駕駛不是物理 AI 的終點(diǎn)。但它可能是這場(chǎng)長(zhǎng)賽道上,最先被真實(shí)世界驗(yàn)證的一張門票。