泛亚·电竞官方网站,雷火竞技,雷火娱乐入口

今天，商湯科技正式發(fā)布并開源日日新 SenseNova U1 系列原生理解生成統(tǒng)一模型。它基于商湯于今年三月自主研發(fā)的 NEO-unify 架構(gòu)，在單一模型架構(gòu)上統(tǒng)一了多模態(tài)理解、推理與生成。

NEO-unify 架構(gòu)徹底摒棄了主流的拼接式，去除了視覺(jué)編碼器（VE）和變分自編碼器（VAE），重新構(gòu)建了統(tǒng)一的表征空間，并且深入融入每一層計(jì)算中，從而實(shí)現(xiàn)從模態(tài)集成向原生統(tǒng)一的范式跨越。

SenseNova U1 系列模型能夠?qū)⒄Z(yǔ)言與視覺(jué)信息作為統(tǒng)一的復(fù)合體直接建模，實(shí)現(xiàn)語(yǔ)言和視覺(jué)信息的高效協(xié)同，讓理解與生成能力同步增強(qiáng)，在保留語(yǔ)義豐富度的同時(shí)，維持像素級(jí)的視覺(jué)保真度。

在邏輯推理與空間智能等方向上，它能夠深度理解物理世界的復(fù)雜布局與精細(xì)關(guān)系；在未來(lái)，它還能為機(jī)器人提供具身大腦，實(shí)現(xiàn)在單一模型閉環(huán)內(nèi)完成從復(fù)雜環(huán)境感知、邏輯推演到精準(zhǔn)任務(wù)執(zhí)行的全過(guò)程，為推動(dòng)技術(shù)與產(chǎn)業(yè)發(fā)展提供重要基礎(chǔ)與關(guān)鍵引擎。

本次開源發(fā)布的是 SenseNova U1 的輕量版系列 SenseNova U1 Lite。它包含兩個(gè)不同規(guī)格的模型：

SenseNova-U1-8B-MoT：基于稠密骨干網(wǎng)絡(luò)

SenseNova-U1-A3B-MoT：基于混合專家（MoE）骨干網(wǎng)絡(luò)

訪問(wèn) GitHub https://github.com/OpenSenseNova/SenseNova-U1 、Hugging Face https://huggingface.co/collections/sensenova/sensenova-u1 了解更多信息。我們也將在近期公布詳實(shí)的技術(shù)報(bào)告。

極致高效，以小搏大：開源 SOTA，比肩商用

效率，是統(tǒng)一模型架構(gòu)的核心技術(shù)優(yōu)勢(shì)。

傳統(tǒng)多模態(tài)模型是把視覺(jué)編碼器和語(yǔ)言骨干通過(guò)適配器拼接在一起的。它像一個(gè) " 說(shuō)不同語(yǔ)言的人組成的工作組 "：有人專門看圖，把圖像翻譯為語(yǔ)言，有人專門理解文字，進(jìn)行推理，有人把結(jié)果再翻譯為設(shè)計(jì)指令，把圖畫出來(lái)。每完成一次任務(wù)，信息都要在不同成員之間來(lái)回傳遞。這個(gè)過(guò)程雖然可行，但難免會(huì)有等待、誤解和信息損耗。為了彌補(bǔ)這些損耗，模型往往需要做得更大才能達(dá)到好的效果。

SenseNova U1 是基于統(tǒng)一表征空間構(gòu)建的，更像是一個(gè)從一開始就同時(shí)掌握多項(xiàng)技能的人。它不是先看懂圖像、再翻譯成文字、再交給另一個(gè)系統(tǒng)理解，而是在同一套 " 思考方式 " 里直接處理圖像、文字等不同信息。圖像和語(yǔ)言不再是兩套系統(tǒng)之間的接力，而是在同一個(gè)大腦中自然融合。這樣帶來(lái)的好處是：信息流轉(zhuǎn)更快捷，理解更直接，生成更高效。模型不需要依賴單純堆大參數(shù)來(lái)彌補(bǔ)中間轉(zhuǎn)換的損耗，而是通過(guò)統(tǒng)一的內(nèi)部表征，把不同模態(tài)的信息以更緊湊、更高密度的方式組織起來(lái)。

簡(jiǎn)單來(lái)說(shuō)，傳統(tǒng)架構(gòu)像是 " 多人協(xié)作、層層轉(zhuǎn)述 "；SenseNova U1 更像是 " 一個(gè)全能大腦，直接理解，直接表達(dá) "。少了中間轉(zhuǎn)譯，信息損耗更低，也能在相對(duì)更精簡(jiǎn)的模型規(guī)模下，實(shí)現(xiàn)更強(qiáng)的多模態(tài)理解與生成能力。

實(shí)驗(yàn)結(jié)果驗(yàn)證了我們的想法。在涵蓋圖像理解、圖像生成與編輯、空間智能和視覺(jué)推理的多項(xiàng)基準(zhǔn)測(cè)試中，SenseNova U1 Lite 均達(dá)到同量級(jí)開源模型 SOTA 水平，為統(tǒng)一多模態(tài)理解與生成樹立了新的標(biāo)桿。甚至僅憑8B-MoT 的較小規(guī)格，就能達(dá)到甚至超越部分大型商業(yè)閉源模型，展現(xiàn)出全維度多領(lǐng)域的統(tǒng)治力。

以下兩組對(duì)比圖更直觀地展現(xiàn)了 SenseNova U1 Lite 在效率上的突出優(yōu)勢(shì)。在通用的圖像生成測(cè)試中，SenseNova U1 Lite 不但在圖像生成質(zhì)量上比肩 Qwen-Image 2.0 Pro 或 Seedream 4.5 等大型閉源模型，達(dá)到商業(yè)級(jí)水準(zhǔn)，還在推理響應(yīng)速度上有顯著優(yōu)勢(shì)。即使在極具挑戰(zhàn)性、開源模型一直做不好的復(fù)雜信息圖生成任務(wù)中，SenseNova U1 Lite 也表現(xiàn)出商業(yè)級(jí)的水準(zhǔn)，對(duì)復(fù)雜信息圖的排版和文字有很強(qiáng)的控制力。

以下實(shí)際例子，展現(xiàn)了 SenseNova U1 Lite 的商業(yè)級(jí)復(fù)雜信息圖生成能力。

我們正在沿著當(dāng)前的技術(shù)路徑繼續(xù) Scale，計(jì)劃在未來(lái)推出體量更大的模型。我們相信，基于高效的原生架構(gòu)，可以以低得多的計(jì)算成本達(dá)到國(guó)際頂尖模型的水平。

業(yè)內(nèi)首創(chuàng)：連續(xù)性圖文創(chuàng)作輸出

憑借 NEO-Unify 架構(gòu)的優(yōu)勢(shì)，SenseNova U1 在業(yè)內(nèi)首個(gè)實(shí)現(xiàn)連續(xù)性的圖文創(chuàng)作輸出。并且只需要單次單模型調(diào)用，就能輸出更高質(zhì)量的作品，相比傳統(tǒng)范式，實(shí)現(xiàn)了效率的大幅提升。

SenseNova U1 所具備的原生圖文理解生成能力，能天然將圖像和文本底層融合信號(hào)完整的保留上下文中，區(qū)別于過(guò)去只能利用多模型串聯(lián)勉強(qiáng)實(shí)現(xiàn)，它的圖像間風(fēng)格具備明顯的高一致性，能在統(tǒng)一表征空間進(jìn)行高效連貫思考。

下面兩個(gè)案例中，SenseNova U1 通過(guò)連貫高保真度的圖文交錯(cuò)思考輸出。

任務(wù)一：五分熟牛排做法：SenseNova U1 可以通過(guò)思考和規(guī)劃產(chǎn)生分步的過(guò)程，并且給每一步輸出對(duì)應(yīng)的圖像展示。各個(gè)步驟的圖示表現(xiàn)出極高的一致性。

任務(wù)二：繪制一個(gè)鋼鐵俠圖案：它可以從掃描草稿出發(fā)，逐步進(jìn)行連續(xù)創(chuàng)作，最終做出一個(gè)完成度很高的圖像。每一步創(chuàng)作的過(guò)程對(duì)于前一步的結(jié)構(gòu)和細(xì)節(jié)都做了精準(zhǔn)的保持 —— 一個(gè)統(tǒng)一表征的共享上下文在其中發(fā)揮了關(guān)鍵作用。

全網(wǎng)開源，即刻可用

開源部署

GitHub：https://github.com/OpenSenseNova/SenseNova-U1

Hugging Face：https://huggingface.co/collections/sensenova/sensenova-u1

歡迎調(diào)用

SenseNova U1 Skill https://github.com/OpenSenseNova/SenseNova-Skills ，瀏覽海量樣例庫(kù)，獲取 Prompt 編寫指南，化繁為簡(jiǎn)（繁雜文 ->有趣圖），讓您的 Agent 成為信息圖生成高手

在線體驗(yàn)

即將上線辦公小浣熊

我們相信，原生統(tǒng)一的多模態(tài)智能是通往 AGI 的必經(jīng)之路。未來(lái)，我們還將持續(xù)推動(dòng)開源生態(tài)建設(shè)，并發(fā)布更大參數(shù)規(guī)模的 U1 系列模型。迎社區(qū)廣大用戶和開發(fā)者提出寶貴建議，共同定義智能交互的未來(lái)。

*NEO-unify 技術(shù)博客：https://www.sensetime.com/cn/news-detail/51170548?categoryId=73

SenseNova U1 Lite 專屬群，歡迎入群掃碼交流 ~ ↓↓↓

电竞比分网-中国电竞赛事及体育赛事平台

宙世代元宇宙

元宇宙黨建解決方案

元宇宙文旅解決方案

元宇宙展廳解決方案

元宇宙行業(yè)峰會(huì)解決方案

元宇宙營(yíng)銷解決方案

元宇宙會(huì)展解決方案

元宇宙演藝節(jié)目解決方案

元宇宙博物館解決方案

元宇宙圖書館解決方案

元宇宙校園解決方案

元宇宙企業(yè)展廳解決方案

元宇宙藝術(shù)展解決方案

元宇宙電商解決方案

融媒體解決方案

ZAKER智慧云

媒體解決方案

黨建解決方案

公檢法解決方案

智慧交通解決方案

高校解決方案

AI視頻

AI視頻剪輯

視頻定制服務(wù)

AI智能客服

我的訂閱

全面開源！商湯日日新 SenseNova U1 發(fā)布，邁向模型理解生成統(tǒng)一時(shí)代

宙世代

一起剪

相關(guān)閱讀

全球最小健康穿戴設(shè)備智能耳環(huán)發(fā)布 體積比AirPods小五倍

不需要內(nèi)存可以早發(fā)！新款Steam手柄定檔5月4日 主機(jī)產(chǎn)品持續(xù)延期

前米哈游高管創(chuàng)業(yè)，AI 原生增長(zhǎng) Agent LeapMind Growth 獲CMC資本領(lǐng)投

16萬(wàn)的車必須賣19萬(wàn)！地平線余凱：不內(nèi)卷要外卷 讓客戶為價(jià)值掏錢

蘋果首款折疊屏iPhone進(jìn)入EVT試產(chǎn) 真機(jī)上手全是AI圖

群核科技VP再創(chuàng)業(yè)：首創(chuàng)3DGS相機(jī)品類，峰瑞資本領(lǐng)投

直接停擺！蘋果iPhone印度擴(kuò)產(chǎn)遇阻 沒(méi)有中國(guó)團(tuán)隊(duì)根本玩不轉(zhuǎn)

OpenAI的手機(jī)，要革手機(jī)的命

讓人類首次把汽車零百加速做到1S以內(nèi)！追覓高管稱造車不需千億資金 小米也就200億

打開計(jì)算新大門！DNA分子計(jì)算機(jī)突破2納米半導(dǎo)體工藝極限

AI世紀(jì)對(duì)決開庭，馬斯克在OpenAI審判中出庭作證

GPU首次看齊游戲主機(jī)！一加Ace 6至尊版圖賞

OPPO Pad Mini明天首銷：3199元起 同檔最強(qiáng)小平板

影石CEO劉靖康談?dòng)跋袷袌?chǎng)天花板：一種攝影機(jī)器人 可全程抓拍

存儲(chǔ)超級(jí)周期點(diǎn)燃最強(qiáng)一季報(bào)：“供不應(yīng)求”或持續(xù)至2027年

最新評(píng)論

雷峰網(wǎng)

熱門推薦

企業(yè)資訊

全面開源！商湯日日新 SenseNova U1 發(fā)布，邁向模型理解生成統(tǒng)一時(shí)代

全球最小健康穿戴設(shè)備智能耳環(huán)發(fā)布體積比AirPods小五倍

不需要內(nèi)存可以早發(fā)！新款Steam手柄定檔5月4日主機(jī)產(chǎn)品持續(xù)延期

前米哈游高管創(chuàng)業(yè)，AI 原生增長(zhǎng) Agent LeapMind Growth 獲CMC資本領(lǐng)投

16萬(wàn)的車必須賣19萬(wàn)！地平線余凱：不內(nèi)卷要外卷讓客戶為價(jià)值掏錢

直接停擺！蘋果iPhone印度擴(kuò)產(chǎn)遇阻沒(méi)有中國(guó)團(tuán)隊(duì)根本玩不轉(zhuǎn)

OpenAI的手機(jī)，要革手機(jī)的命

讓人類首次把汽車零百加速做到1S以內(nèi)！追覓高管稱造車不需千億資金小米也就200億

AI世紀(jì)對(duì)決開庭，馬斯克在OpenAI審判中出庭作證

OPPO Pad Mini明天首銷：3199元起同檔最強(qiáng)小平板

影石CEO劉靖康談?dòng)跋袷袌?chǎng)天花板：一種攝影機(jī)器人可全程抓拍