电竞比分网-中国电竞赛事及体育赛事平台

關(guān)于ZAKER Skills 合作
i黑馬 10分鐘前

商湯發(fā)布并開源 U1 系列 單一模型架構(gòu)能否撬動(dòng)多模態(tài)市場(chǎng)

4 月 28 日,商湯科技發(fā)布并開源日日新 SenseNova U1 系列原生理解生成統(tǒng)一模型。該系列基于今年 3 月商湯自主研發(fā)的 NEO unify 架構(gòu),在單一模型上統(tǒng)一了多模態(tài)理解、推理與生成。

傳統(tǒng)多模態(tài)模型多采用視覺編碼器搭配語(yǔ)言骨干的拼接方式,存在信息損耗。SenseNova U1 去除了視覺編碼器和變分自編碼器,直接在像素上運(yùn)行,重建統(tǒng)一表征空間。

該架構(gòu)由商湯與南洋理工大學(xué) S Lab 合作研發(fā),讓圖像和文本在同一套表征體系中被直接處理,減少了模塊間的信息損耗和延遲。

商湯本次開源的是輕量版 SenseNova U1 Lite,包含兩個(gè)規(guī)格:基于稠密網(wǎng)絡(luò)的 8B MoT 版本,以及采用混合專家架構(gòu)的 A3B MoT 版本。

相關(guān)代碼已在 GitHub 和 Hugging Face 平臺(tái)上線。商湯表示,未來計(jì)劃推出體量更大的版本并公布詳細(xì)技術(shù)報(bào)告。

效率是該模型較為突出的特點(diǎn)。8B 參數(shù)規(guī)模下,它在多模態(tài)理解、生成與推理等多個(gè)維度上逼近甚至部分超越一些商業(yè)閉源模型。

在 AI2D 等理解基準(zhǔn)中拿到 91.7 分,在復(fù)雜信息圖生成任務(wù)中平均得分 50.7,是目前開源模型里表現(xiàn)最強(qiáng)的。

在通用圖像生成測(cè)試中,生成質(zhì)量可比肩 Qwen Image 2.0 Pro 或 Seedream 4.5,同時(shí)推理響應(yīng)速度更快。

視覺推理方面,在 VBVR(UMM)測(cè)試中拿到 60.5 分,高于 Nano Bananaz 的 49.6。在 WISE 維度上取得 69.0 分,領(lǐng)先于 Qwen Image 的 63.0。

此外,SenseNova U1 支持連續(xù)性圖文創(chuàng)作輸出,只需單次單模型調(diào)用即可完成分步驟圖文生成,圖像風(fēng)格保持高度連貫,這在行業(yè)內(nèi)屬首次實(shí)現(xiàn)。

該模型還表現(xiàn)出較強(qiáng)的物理空間理解能力,未來可應(yīng)用于機(jī)器人系統(tǒng),在單一模型閉環(huán)內(nèi)完成環(huán)境感知、推理和任務(wù)執(zhí)行。

商湯此次開源并非孤立行動(dòng)。在國(guó)內(nèi)開源大模型市場(chǎng),阿里巴巴通義千問(Qwen)系列占據(jù)明顯優(yōu)勢(shì),截至 2026 年 3 月累計(jì)下載量突破 10 億次,占全球開源模型總下載量 50% 以上。

DeepSeek 則通過持續(xù)的價(jià)格策略壓低了 AI 調(diào)用成本。商湯選擇在這個(gè)時(shí)間點(diǎn)開源 U1,市場(chǎng)分析認(rèn)為其意圖是從收取短期授權(quán)費(fèi)轉(zhuǎn)向構(gòu)建開發(fā)者生態(tài),復(fù)制阿里巴巴 Qwen 的路徑,通過模型免費(fèi)帶動(dòng)周邊服務(wù)和基礎(chǔ)設(shè)施實(shí)現(xiàn)商業(yè)變現(xiàn)。

開源能否幫助商湯在阿里 Qwen 已經(jīng)占據(jù)主導(dǎo)的市場(chǎng)上打開局面,目前尚無定論。對(duì)商湯而言,關(guān)注點(diǎn)已從單一模型的技術(shù)指標(biāo),轉(zhuǎn)向 SenseNova 整個(gè)生態(tài)系統(tǒng)的開發(fā)者活躍度和實(shí)際應(yīng)用規(guī)模。

當(dāng)技術(shù)架構(gòu)的創(chuàng)新已經(jīng)落地,接下來的問題在于開發(fā)者是否愿意遷移,以及與之配套的工具鏈和服務(wù)能否形成足夠的黏性。

相關(guān)標(biāo)簽

相關(guān)閱讀

最新評(píng)論

沒有更多評(píng)論了

覺得文章不錯(cuò),微信掃描分享好友

掃碼分享

熱門推薦

查看更多內(nèi)容

企業(yè)資訊

查看更多內(nèi)容