电竞比分网-中国电竞赛事及体育赛事平台

關(guān)于ZAKER Skills 合作
全天候科技 17小時前

效率提升 9 倍!英偉達(dá)新模型 Nemotron 3 Nano Omni 瞄準(zhǔn)智能體落地,整合語音、視覺與推理能力

在人工智能智能體(AI Agent)競賽持續(xù)升溫之際,英偉達(dá)正加速從 " 算力霸主 " 向 " 模型平臺商 " 延伸。

美東時間 28 日周二,英偉達(dá)在公司博客宣布,推出名為 Nemotron 3 Nano Omni 的全新開源模型,主打 " 原生全模態(tài)理解 + 高效推理 ",試圖為企業(yè)級 AI Agent 提供一體化基礎(chǔ)模型底座。英偉達(dá)介紹,這款業(yè)內(nèi)領(lǐng)先的開源全模態(tài)推理模型融合了視覺、音頻與語言能力,將幫助 AI 智能體實(shí)現(xiàn)高達(dá) 9 倍的效率提升。

英偉達(dá)介紹,已有一批 AI 與軟件領(lǐng)域的公司率先采用了 Nemotron 3 Nano Omni,包括 Aible、Applied Scientific Intelligence ( ASI ) 、Eka Care、富士康、H Company、Palantir 和 Pyler。此外,戴爾、DocuSign、Infosys、K-Dense、Lila、甲骨文和 Zefr 正在對該模型進(jìn)行評估。

主打 Omni:一個模型打通語音、視覺與語言

不同于傳統(tǒng)多模態(tài)模型通常通過拼接多個子模型實(shí)現(xiàn)能力融合,Nemotron 3 Nano Omni 強(qiáng)調(diào) " 原生全模態(tài)(omni-understanding)"。其可同時處理文本、圖像、音頻甚至視頻輸入,并在統(tǒng)一架構(gòu)內(nèi)完成理解與推理任務(wù)。

英偉達(dá)在技術(shù)博客中指出,該模型具備從視頻和文檔中提取信息的能力,支持復(fù)雜場景下的跨模態(tài)推理,例如通過語音轉(zhuǎn)錄增強(qiáng)視頻理解,或結(jié)合 OCR 解析視覺文本內(nèi)容。

從架構(gòu)上看,Nemotron 3 Nano Omni 延續(xù)了 Nemotron 3 系列的混合架構(gòu)路線:融合 Transformer 與 Mamba 機(jī)制,并引入混合專家(MoE)以在保持性能的同時大幅降低推理成本。

瞄準(zhǔn) AI 智能體 從理解走向執(zhí)行

此次發(fā)布的核心關(guān)鍵詞并非多模態(tài),而是智能體。英偉達(dá)明確將 Nemotron 3 系列定位為代理式(agentic)AI 的基礎(chǔ)模型,即不僅用于生成內(nèi)容,更用于驅(qū)動具備決策與執(zhí)行能力的智能體系統(tǒng)。

官方資料顯示,Nano Omni 是首個 " 生產(chǎn)級開放模型 ",專為構(gòu)建可擴(kuò)展 AI Agent 設(shè)計,支持長上下文、多步驟推理以及工具調(diào)用等能力。

同時,該模型還引入 GUI 訓(xùn)練數(shù)據(jù),使 AI 可以理解和操作界面元素,進(jìn)一步貼近真實(shí)應(yīng)用場景,例如自動化辦公流程、軟件操作甚至復(fù)雜工作流執(zhí)行。

媒體解讀認(rèn)為,這種 " 全模態(tài) +Agent" 組合意味著 AI 系統(tǒng)可以直接處理現(xiàn)實(shí)世界中的非結(jié)構(gòu)化數(shù)據(jù)(視頻、語音、文檔),并據(jù)此做出決策,從而拓展 AI 在企業(yè)中的落地邊界。

效率仍是核心賣點(diǎn):小模型撬動大能力

盡管能力擴(kuò)展至多模態(tài)與智能體場景,Nemotron 3 Nano Omni 仍延續(xù) "Nano" 定位,即強(qiáng)調(diào)高性價比與推理效率。

Nemotron 3 Nano 基礎(chǔ)模型采用約 300 億參數(shù)規(guī)模,但通過 MoE 機(jī)制每次僅激活參數(shù) 30 億,在性能與成本之間取得平衡。同時,該系列模型支持超長上下文(最高達(dá)百萬 token 級別),適合處理復(fù)雜文檔與長流程任務(wù)。

在英偉達(dá)整體產(chǎn)品體系中,Nano、Super 與 Ultra 形成梯度:Nano 強(qiáng)調(diào)效率,Super 面向高吞吐企業(yè)場景,Ultra 則瞄準(zhǔn)前沿推理能力。

開源生態(tài)對抗閉源陣營

值得注意的是,英偉達(dá)再次強(qiáng)調(diào) " 開放 "。Nemotron 3 Nano Omni 不僅開放模型權(quán)重,還配套提供訓(xùn)練數(shù)據(jù)、工具鏈(如 NeMo)以及優(yōu)化方案,試圖打造完整開發(fā)生態(tài)。

這一策略正值 AI 行業(yè)分化加劇之際:一方面,部分頭部廠商逐步轉(zhuǎn)向閉源;另一方面,中國及開源社區(qū)持續(xù)推進(jìn)開放模型。英偉達(dá)試圖以 " 開放 + 高性能 " 切入中間地帶,吸引開發(fā)者與企業(yè)客戶。

從更宏觀角度看,隨著 AI 應(yīng)用從 " 聊天機(jī)器人 " 邁向 " 智能代理 ",模型能力的競爭也從單一語言理解升級為多模態(tài)融合 + 任務(wù)執(zhí)行能力的系統(tǒng)競爭。

Nemotron 3 Nano Omni 的推出,標(biāo)志著英偉達(dá)不僅要賣 " 鏟子 "(GPU),也要提供 " 施工方案 "(模型與工具鏈),進(jìn)一步加深其在 AI 產(chǎn)業(yè)鏈中的縱深布局。

相關(guān)標(biāo)簽
全天候科技

全天候科技

提供專業(yè)快速完整的科技商業(yè)資訊

訂閱

覺得文章不錯,微信掃描分享好友

掃碼分享

熱門推薦

查看更多內(nèi)容

企業(yè)資訊

查看更多內(nèi)容