电竞比分网-中国电竞赛事及体育赛事平台

關(guān)于ZAKER Skills 合作
量子位 1小時前

小米雙模型正式開源 !MiMo-V2.5-Pro 無中斷肝出“ macOS ”

聞樂 發(fā)自 凹非寺

量子位 | 公眾號 QbitAI

先別聊什么參數(shù)、benchmark 了,來看個狠活——

米版 "macOS Sequoia" 桌面系統(tǒng)(doge)。

開機動畫、用戶登錄、窗口管理、Dock 欄縮放、Spotlight 搜索、明暗顯示風(fēng)格、Launchpad 啟動臺,全都有。

還自帶 54 個原生應(yīng)用,打開計算器能算賬,打開日歷能看日子,打開地圖能查地址,打開備忘錄能寫東西,Grapher 還能畫 3D 函數(shù)圖……拖一拖轉(zhuǎn)一轉(zhuǎn),挺像那么回事。

甚至!還有個能真實沖浪的 Safari 瀏覽器,好你個 "Aqqle"(狗頭 .jpg)。

關(guān)鍵這個系統(tǒng)是 AI 4 個小時全程無中斷、無人類接管,就這么一直肝出來的。

沒錯,用的就是主打長程任務(wù)、模糊指令遵循,躋身國產(chǎn) Agent 第一梯隊的小米MiMo V2.5 Pro

小米最新發(fā)布的 MiMo V2.5 系列,包含 Pro 旗艦 Agent、全模態(tài)基座、TTS 語音合成、ASR 語音識別四大模型,綜合實力對標國際頂尖水準。

就在今天凌晨,MiMo-V2.5 系列模型(包含 base 版)已經(jīng)正式官宣開源,權(quán)重全量開放

4 個月,從入場到進入開源第一梯隊,小米這位 " 超速 " 選手,咱得扒一扒。

國際頂模的飯桌,它坐上去了

先看看成績單。

首先,新一代模型在通用智能體能力、復(fù)雜軟件工程與長程任務(wù)三大核心維度,相較前代 MiMo-V2-Pro 實現(xiàn)顯著躍升。

國際競技場上,在 Coding Agent、SWE-Bench Pro、GDPVal-AA 等多項權(quán)威基準測試中成績逼近 Claude Opus 4.6、GPT-5.4 等頂尖閉源模型,甚至大幅超越 Gemini 3.1 Pro。

這么看下來,MiMo V2.5-Pro 不僅躋身國產(chǎn)開源第一梯隊,而且已經(jīng)跟 Claude Opus 4.6、GPT-5.4 等國際頂模坐在一張桌子上吃飯了。

要說劃個重點,小米這次升級,最主要的是長周期任務(wù)和模糊指令遵循能力。

官方數(shù)據(jù)顯示,它可以穩(wěn)定支撐超千次工具調(diào)用的長周期任務(wù),自主完成人類專家數(shù)天甚至數(shù)周的高難度工作。

就拿北大 SysY 項目來說,從零寫一個完整編譯器這種級別的復(fù)雜工程,MiMo V2.5-Pro 自己吭哧吭哧就能從頭肝到尾,詞法分析、語法分析、中間代碼生成、RISC-V 后端、性能優(yōu)化……全包。

4.3 小時、672 次工具調(diào)用,任務(wù)中間都能不崩、不跑偏、不失憶,拿到 233/233 的滿分。

還有個事兒必須提一嘴——Token 效率

在 ClawEval 標準 Agent 任務(wù)中,MiMo 單軌跡只用約 7 萬 Token,就能達到 64% 的 Pass 通過率。

而 Claude Opus 4.6、Gemini 3.1 Pro、GPT-5.4,普遍在 12-18 萬 Token。

同樣的能力,一樣的效果,MiMo 直接省了 40%-60% 的成本

這 "Token 半功倍 " 實打?qū)嵉氖″X能力,咱還真得點個贊。

不只代碼強,小米模型的語音能力也齊活了。

V2.5 家族里的 TTS 支持文本描述造音色、零樣本克隆,不用上傳參考音頻,直接用文字描述就能生成想要的聲線;

視頻地址:https://mp.weixin.qq.com/s/TX5_KfchdvfWGd0iltwcdw

ASR 拿到中英 SOTA,粵語、川語、吳語、閩南語都能識別,連帶伴奏的歌詞都能精準轉(zhuǎn)寫。

而且,MiMo-V2.5-Pro 和 MiMo-V2.5 都標配了 1M 上下文窗口,音頻模型也大幅進化,從基座到 TTS、ASR 全棧升級,一個不落。

好好好,小米這波根本不是單點突圍,這是直接端出了一整套 Agent 全家桶啊……

那它到底有多能跑?咱上實測!

實測,真不虛!

必須得來扒一下開頭那個 macOS 系統(tǒng)的代碼層,畢竟效果是真行。

整個項目由 React 18+TypeScript+Zustand+Tailwind CSS 以及 Vite 構(gòu)建,68 個組件撐起了 54 個原生應(yīng)用。

XcodeApp 里面塞了一個真實可瀏覽的網(wǎng)頁引擎、包含完整的國際象棋邏輯的小游戲,支持 3D 函數(shù)繪圖的 Grapher 等等。

窗口管理系統(tǒng)也不是簡單的彈個框,做了一套完整的窗口狀態(tài)機:拖拽、縮放、最小化、最大化、焦點切換、z-index 層級管理、還復(fù)刻了 macOS 標志性的 Traffic Lights 三色燈邏輯。

4 個小時,MiMo-V2.5 Pro 自己把這套架構(gòu)搭起來、把 54 個應(yīng)用一個個填滿、把窗口管理的狀態(tài)同步理順。

全程無中斷、無人類接管,這編程能力屬實是不虛,真把人類程序員給解放了。

然后,我把模型接到了龍蝦里,給了一個超長提示詞,讓它從零開發(fā)了一個 3D 像素風(fēng)農(nóng)場模擬游戲。

什么 3D 場景搭建、像素風(fēng)格美術(shù)、作物生長系統(tǒng)、天氣循環(huán)、玩家交互邏輯……全都給我塞進去。

MiMo-V2.5 Pro 一路肝下來,從架構(gòu)到核心玩法,工程量大環(huán)節(jié)多的農(nóng)場給我搞定了。

最終交出來的版本質(zhì)感很足。畫面里是三種不同顏色劃分的農(nóng)場區(qū)域,外圍還點綴著像素風(fēng)花草點綴氛圍;

商店里能買到胡蘿卜、番茄、南瓜三種作物,游戲里不僅有晴雨交替的天氣變化,還做了實時更新的金幣計數(shù)和像素小人的體力條。

那就開始種地吧!

進游戲第一件事,先鋤地??钢z頭走到空地上,DuangDuangDuang 幾下,一塊耕地就出來了。

然后去商店買種子,番茄、小麥、胡蘿卜……選完往兜里一揣,回到地里一顆顆種下去。

種完澆水,看著小苗苗冒頭,作物成熟之后會有閃光效果,這時候就能收獲了,收割完再去商店賣掉,金幣叮叮當(dāng)當(dāng)?shù)劫~了~

從場景裝飾到核心玩法,一套完整閉環(huán)直接拉滿,種地→澆水→收獲→賣錢→再買種子→再種……好,循環(huán)起來停不下,賽博種地也太上頭了??!

接下來,我用 MiMo-V2.5 做了一個山野風(fēng)格治愈系自然漫游數(shù)字手賬本。

和小游戲不一樣,咱這次就給了一句大白話:

幫我做個山野風(fēng)格的治愈系網(wǎng)站,像一本旅行手賬,自然、安靜、有呼吸感,那種逃離城市走進曠野的感覺。

沒給配色、沒給字體、沒給布局、沒給動效方案,啥都沒給。

這類任務(wù)考驗的就是模糊指令理解了,山野到底是個啥感覺?治愈系配色要怎么搭?

MiMo-V2.5 的理解是:大地色系、手寫感字體、墨水質(zhì)感、以及柔和的動畫。

于是,我就得到了一個細節(jié)拉滿、內(nèi)容豐富的手賬。

山巒背景做視差,滾動的時候遠近山層拉出縱深感,畫面上還飄著小粒子。鼠標一挪,柔和光暈就跟過來了。

復(fù)選框點擊還有彈跳動畫,全文滾動的時候每個元素都是淡入淡出,氛圍感滿滿。

甚至最后的手賬本還有交互功能,行囊里的裝備可以標記選擇,這個小設(shè)計屬于意外之喜了。

沒告訴它具體用什么顏色、什么字體,它自己從山野這個詞里讀懂了我要的氛圍,自行完成了交互、視覺和動效。

這種模糊指令遵循能力,最適合普通人上手,不用把提示詞寫成 PRD(產(chǎn)品需求文檔),大白話也能出好東西。

代碼能力看完了,語音這塊兒咱也得試試!

讓 MiMo-V2.5-TTS 一個人撐起一臺戲,分別生成了三種角色聲音,年輕理性女生音、中年夜市老板音、吃貨少年音,來場減肥辯論!

視頻地址:https://mp.weixin.qq.com/s/TX5_KfchdvfWGd0iltwcdw

出來的效果嘛……各有各的味兒,毫不串戲~

最后試試 ASR 語音識別。

丟了一段粵語過去,轉(zhuǎn)寫結(jié)果基本準確,只有最后一句的 " 歡迎來到香港 " 的 " 來 " 聽錯了,不過無傷大雅,識別度達到 99.999%。

視頻地址:https://mp.weixin.qq.com/s/TX5_KfchdvfWGd0iltwcdw

只能說,小米這波語音能力補齊的姿勢,屬實優(yōu)雅。

4 個月,它拿出了真東西

效果看完了,最后咱聊聊這支團隊。

小米 AI 團隊這波節(jié)奏,確實有點超出預(yù)期,從去年年底 V2 系列進場,到現(xiàn)在 V2.5 沖到開源第一梯隊,前后也就 4 個月時間。

放在行業(yè)里,正常節(jié)奏基本上是 8-12 個月,小米相當(dāng)于直接把周期砍了一半。

快也就算了,它東西還齊,旗艦、全模態(tài)、全鏈路語音模型一口氣全更完。

好好好," 趕工期 " 趕出頂尖全家桶,也是頭一回見(doge) 。

當(dāng)然了,咱用戶雖然看中模型能力,但性價比咱也真的很在乎。

小米這次全系升級到 1M 上下文,但憑借著超高 Token 效率,計費規(guī)則反而簡化了。

1M 和 256K 采取同樣的 Credit 倍率,Pro 從 4x 降到 2x,標準版從 2x 降到 1x。

加上夜間再打 8 折(北京時間 00:00~08:00)Token Plan 用戶 Credits 全量重置,這組合拳打下來,就倆字——

普惠。讓普通用戶和開發(fā)者都能低成本體驗高階 AI 能力。

這不,國外開發(fā)者馬上種草了。

技術(shù)做得好,落地普及也得跟上。小米顯然懂這個道理,于是在打折之外,又端出 MiMo Orbit 這個開發(fā)者扶持計劃。

這個計劃分兩塊:

一塊是百萬億 Token 創(chuàng)造者激勵計劃,面向 AI 開發(fā)者發(fā)放 100 萬億 Token,完全免費。全球個人開發(fā)者、團隊、企業(yè)都能申請參與。

而且小米方面會認真評估每份申請,按需發(fā)放,確保 Token 給到真正需要的人手里。

另一塊是面向全球新興 Agent 框架,提供起步階段的專項支持。

不管你的框架做到什么階段、用戶規(guī)模多大,MiMo 都愿意當(dāng)你的底層模型引擎。

不僅限免接入,還會搞定底層適配技術(shù)的技術(shù)支持,幫你把用戶體驗門檻拉低到……幾乎沒有門檻。

我看明白了,這是個 " 手牽手我們一起走,創(chuàng)造幸福的生活~" 的大動作(期待 .jpg)。

放在當(dāng)下這個節(jié)點看,其實也不難理解——

國際上幾家家底厚的模型已經(jīng)把生態(tài)鋪得很穩(wěn),開發(fā)者習(xí)慣基本固定,后來者想擠進去并不容易。國產(chǎn)模型想要站穩(wěn),速度、實力、誠意三樣缺一不可。

小米的打法很明確:用更快的迭代搶時間,用更強的能力留用戶,用真金白銀降低大家的嘗試成本。

算不算 " 彎道超車 " 不好說,但至少態(tài)度和動作都很干脆。

至于能不能真正站穩(wěn),雖然最后還是得開發(fā)者說了算,但就這份答卷來看,小米這支 AI 團隊是真 · All in。

下一個 4 個月,它會掏出什么呢?我先蹲一波~

體驗地址:https://aistudio.xiaomimimo.com/

相關(guān)標簽

覺得文章不錯,微信掃描分享好友

掃碼分享

熱門推薦

查看更多內(nèi)容

企業(yè)資訊

查看更多內(nèi)容