商湯科技近日宣布正式開源日日新 SenseNova U1 系列原生理解生成統(tǒng)一模型,為人工智能領(lǐng)域注入全新技術(shù)動(dòng)能。該模型基于今年 3 月自主研發(fā)的 NEO-unify 架構(gòu),突破傳統(tǒng)多模態(tài)模型依賴拼接式設(shè)計(jì)的局限,在單一框架內(nèi)實(shí)現(xiàn)理解、推理與生成能力的深度融合,標(biāo)志著人工智能技術(shù)從 " 模塊化集成 " 向 " 原生統(tǒng)一 " 范式的關(guān)鍵轉(zhuǎn)型。
核心架構(gòu)創(chuàng)新方面,NEO-unify 通過(guò)徹底重構(gòu)表征空間實(shí)現(xiàn)技術(shù)突破。研發(fā)團(tuán)隊(duì)移除了視覺(jué)編碼器與變分自編碼器等傳統(tǒng)組件,構(gòu)建出語(yǔ)言與視覺(jué)信息深度交織的統(tǒng)一計(jì)算層。這種設(shè)計(jì)使模型能夠直接處理復(fù)合模態(tài)數(shù)據(jù),在保持語(yǔ)義完整性的同時(shí)實(shí)現(xiàn)像素級(jí)視覺(jué)還原,尤其在三維空間關(guān)系解析和物理世界邏輯推演方面展現(xiàn)出顯著優(yōu)勢(shì)。實(shí)驗(yàn)數(shù)據(jù)顯示,該模型在空間智能測(cè)試中的準(zhǔn)確率較傳統(tǒng)架構(gòu)提升 37%,復(fù)雜場(chǎng)景理解能力達(dá)到行業(yè)領(lǐng)先水平。
技術(shù)落地層面,商湯科技已制定清晰的產(chǎn)業(yè)化路線圖。針對(duì)具身智能發(fā)展需求,SenseNova U1 將被打造為機(jī)器人核心認(rèn)知系統(tǒng),通過(guò)單一模型閉環(huán)實(shí)現(xiàn)環(huán)境感知、決策規(guī)劃與動(dòng)作執(zhí)行的有機(jī)整合。此次開源行動(dòng)同步釋放了模型訓(xùn)練框架與開發(fā)工具鏈,為行業(yè)提供從底層架構(gòu)到應(yīng)用部署的全鏈條技術(shù)支撐。業(yè)內(nèi)專家指出,這種高集成度的通用架構(gòu)將有效降低多模態(tài) AI 開發(fā)門檻,推動(dòng)智能體在工業(yè)質(zhì)檢、醫(yī)療輔助等場(chǎng)景的規(guī)?;瘧?yīng)用。