电竞比分网-中国电竞赛事及体育赛事平台

關(guān)于ZAKER 合作
鈦媒體 13分鐘前

微軟自研圖像模型再降價(jià) ? 41%,當(dāng)納德拉開(kāi)始用“毛利率”定義 AI 模型

4 月 15 日,微軟正式發(fā)布 MAI-Image-2-Efficient,這是其旗艦文生圖模型 MAI-Image-2 的低成本、高速度變體。新模型定價(jià)為每百萬(wàn)輸入 token 5 美元、每百萬(wàn)輸出圖像 token 19.5 美元,較 MAI-Image-2 的 33 美元輸出定價(jià)下降約 41%。

微軟聲稱,該模型在 NVIDIA H100 硬件上運(yùn)行速度快 22%,每 GPU 吞吐量效率提升 4 倍,延遲表現(xiàn)優(yōu)于谷歌 Gemini 3.1 Flash、Gemini 3.1 Flash Image 及 Gemini 3 Pro Image 三款模型平均 40%(基于 p50 中位數(shù)基準(zhǔn)測(cè)試)。

這是微軟 AI 超級(jí)智能團(tuán)隊(duì)(MAI Superintelligence team)自 2025 年 11 月公開(kāi)亮相以來(lái)推出的一整套模型矩陣中的最新成果,也是該團(tuán)隊(duì)首次實(shí)現(xiàn)旗艦?zāi)P桶l(fā)布后不到一個(gè)月即推出優(yōu)化變體的 " 初創(chuàng)公司式 " 迭代節(jié)奏。而這一切的背后,是微軟與 OpenAI 曾經(jīng)定義生成式 AI 時(shí)代的合作伙伴關(guān)系正在出現(xiàn)明顯裂痕。

雙模型策略:Efficient 與 Flagship

微軟將 MAI-Image-2-Efficient 定位為 " 生產(chǎn)線工具 ",目標(biāo)場(chǎng)景包括產(chǎn)品攝影、營(yíng)銷創(chuàng)意、UI 樣機(jī)、品牌資產(chǎn)管道和實(shí)時(shí)交互應(yīng)用。該模型能夠干凈地處理標(biāo)題和標(biāo)簽等短文本,適用于批處理環(huán)境的嚴(yán)格延遲和預(yù)算約束。

而 MAI-Image-2 則繼續(xù)擔(dān)任 " 精密儀器 " 角色——當(dāng)需求涉及最高級(jí)別的照片級(jí)真實(shí)感、復(fù)雜風(fēng)格化(如動(dòng)漫或插畫(huà))或更長(zhǎng)更復(fù)雜的圖像內(nèi)文字時(shí),企業(yè)客戶仍需選擇旗艦?zāi)P汀?/p>

這種分層配對(duì)策略并非微軟首創(chuàng)。OpenAI 的 GPT 模型梯隊(duì)、Anthropic 的 Haiku-Sonnet-Opus 產(chǎn)品線、谷歌的 Flash-Pro 區(qū)分,都采用了類似的定價(jià)邏輯。但在圖像生成領(lǐng)域,單張圖像的成本經(jīng)濟(jì)學(xué)可能決定規(guī)?;渴鸬某蓴?。

據(jù)報(bào)道,該模型已在 Arena.ai(原 LMArena)圖像生成排行榜上位列第三,僅次于谷歌 Gemini 3.1 Flash 和 OpenAI 的 GPT Image 1.5。評(píng)測(cè)者指出,MAI-Image-2 的照片真實(shí)感是 " 真正的優(yōu)勢(shì) ",文字渲染能力 " 超出預(yù)期地一致處理復(fù)雜排版 "。在某些直接對(duì)比中,MAI-Image-2 甚至在圖像質(zhì)量和文字渲染上超越 OpenAI 的 GPT Image 1.5 ——盡管在排行榜上仍居其后。

但原模型也存在顯著限制:生成間隔 30 秒冷卻時(shí)間、原生界面每日 15 張上限、僅支持 1:1 寬高比、缺乏圖生圖功能,以及會(huì)屏蔽無(wú)害創(chuàng)意提示的激進(jìn)內(nèi)容過(guò)濾。此次 Efficient 版本是否繼承或放寬這些限制,微軟在公告中未予說(shuō)明。

微軟 -OpenAI 聯(lián)盟松動(dòng)

但這次發(fā)布不能孤立理解,特別是當(dāng)下微軟與 OpenAI 關(guān)系已經(jīng)出現(xiàn)明顯裂痕。

4 月 12 日,OpenAI 新任首席營(yíng)收官 Denise Dresser 向員工發(fā)送了一份內(nèi)部備忘錄。據(jù)報(bào)道,備忘錄在批評(píng)競(jìng)爭(zhēng)對(duì)手 Anthropic 的同時(shí),也提到 " 我們與 Microsoft 的合作是我們成功的基礎(chǔ),但它也限制了我們?cè)谄髽I(yè)所在的地方與他們相遇的能力,對(duì)很多企業(yè)來(lái)說(shuō),那個(gè)地方是 Bedrock"。備忘錄稱,自 2 月底宣布與 Amazon 合作以來(lái),來(lái)自客戶的入站需求 " 坦率地說(shuō)令人震驚 "。

微軟早在 2024 年 7 月底的年度報(bào)告中(10-K 表格)已將 OpenAI 列入競(jìng)爭(zhēng)對(duì)手名單。而 OpenAI 則通過(guò) CoreWeave、谷歌和甲骨文多元化其云基礎(chǔ)設(shè)施,減少對(duì)微軟 Azure 的依賴。

MAI 模型家族是微軟這一戰(zhàn)略脫鉤最具體的表達(dá)。當(dāng)微軟能夠以每百萬(wàn)輸出 token 19.5 美元的成本用自研模型生成生產(chǎn)級(jí)質(zhì)量圖像時(shí),繼續(xù)授權(quán) OpenAI 圖像模型并與其分享收入的算盤(pán)就會(huì)發(fā)生戲劇性轉(zhuǎn)變。每一個(gè)達(dá)到生產(chǎn)質(zhì)量的 MAI 模型,都是微軟可能從 OpenAI 資產(chǎn)負(fù)債表移至自己賬下的項(xiàng)目。

此前,3 月 17 日,據(jù)微軟官方博客披露的全面重組中,將消費(fèi)者和商業(yè) Copilot 業(yè)務(wù)統(tǒng)一至單一領(lǐng)導(dǎo)團(tuán)隊(duì),Jacob Andreou 升任 Copilot 執(zhí)行副總裁直接向納德拉匯報(bào)。關(guān)鍵的是,Mustafa Suleyman (微軟 AI CEO,主導(dǎo)組建 MAI 超級(jí)智能團(tuán)隊(duì))的角色也被重新聚焦。納德拉在給員工的信中寫(xiě)道,公司正在 " 加倍投入超級(jí)智能使命,用人才和算力構(gòu)建在評(píng)估、成本削減(COGS reduction)和前沿推進(jìn)方面產(chǎn)生實(shí)際產(chǎn)品影響的模型 "。

"COGS reduction" 這一企業(yè)黑話直指經(jīng)濟(jì)動(dòng)機(jī):每節(jié)省一美元授權(quán)費(fèi)用,就直接流入毛利率,即降低每生成一張圖所消耗的算力、推理和運(yùn)營(yíng)費(fèi)用。

為什么便宜快速的圖像生成至關(guān)重要

還有一個(gè)維度讓此次發(fā)布具有戰(zhàn)略意義,且可能是最重要的一個(gè):AI Agent 的崛起。

據(jù)報(bào)道,微軟正在測(cè)試將類似 OpenClaw 的功能集成到 Microsoft 365 Copilot 中,構(gòu)建可長(zhǎng)時(shí)間執(zhí)行多步驟任務(wù)的 always-on agent。公司已推出 Copilot Cowork(在 Microsoft 365 應(yīng)用內(nèi)行動(dòng)的 agent)、Copilot Tasks(完成多步驟個(gè)人生產(chǎn)力任務(wù)的 agent)和 Agent 365(納德拉重組備忘錄中提及)。預(yù)計(jì)將在 6 月的 Build 大會(huì)上展示這些 agent 能力。

在 Agent 世界—— AI 系統(tǒng)不僅回答問(wèn)題,還能自主執(zhí)行復(fù)雜工作流——圖像生成成為 agent 可編程調(diào)用的基礎(chǔ)組件,而非用戶手動(dòng)交互的獨(dú)立產(chǎn)品。一個(gè)構(gòu)建營(yíng)銷活動(dòng)的企業(yè) agent 可能需要生成數(shù)十張產(chǎn)品圖片、創(chuàng)建社交媒體素材、制作演示圖形,并在無(wú)人干預(yù)的情況下迭代設(shè)計(jì)概念。

這種工作流的經(jīng)濟(jì)學(xué)完全由 per-token pricing(按 token 計(jì)費(fèi))和延遲支配,而這正是 MAI-Image-2-Efficient 優(yōu)化的核心。如果微軟對(duì) Copilot 的愿景涉及在日常大型工作流中例行調(diào)用圖像生成的 agent,那么這些 agent 需要的圖像生成必須足夠快以不造成瓶頸、足夠便宜以在每天數(shù)千次調(diào)用時(shí)不破壞成本預(yù)測(cè)。

4 倍效率提升和 41% 價(jià)格削減不只是漂亮的營(yíng)銷數(shù)字——它們是微軟押注公司的 Agent 未來(lái)的架構(gòu)要求。

此次發(fā)布仍有若干關(guān)鍵問(wèn)題未解答。

微軟未披露 MAI-Image-2-Efficient 是否解決了評(píng)測(cè)者在原模型中指出的寬高比限制和激進(jìn)內(nèi)容過(guò)濾。公司也未說(shuō)明質(zhì)量與速度的權(quán)衡是否在復(fù)雜提示下涉及可見(jiàn)的質(zhì)量下降——公告中將 " 生產(chǎn)就緒質(zhì)量 " 和 " 旗艦質(zhì)量 " 互換使用,但任何類型的蒸餾模型通常都涉及某種質(zhì)量讓步。

MAI Playground 目前僅在美國(guó)等選定市場(chǎng)可用,歐盟可用性列為 "coming soon"。Copilot 集成正在進(jìn)行但未完成。通過(guò) Foundry 的企業(yè) API 雖已上線,仍處于早期部署階段。

但軌跡明確無(wú)誤。在 MAI 超級(jí)智能團(tuán)隊(duì)宣布后不到五個(gè)月,微軟已推出一個(gè)旗艦圖像模型、三個(gè)其他基礎(chǔ)模型,以及現(xiàn)在的成本優(yōu)化生產(chǎn)變體——所有這些都在重組整個(gè) Copilot 組織、應(yīng)對(duì)與最重要 AI 合作伙伴的破裂關(guān)系、并為可能重新定義企業(yè)生產(chǎn)力的 Agent 功能奠定基礎(chǔ)的同時(shí)完成。

對(duì)于這家在生成式 AI 時(shí)代前兩年主要轉(zhuǎn)售他人技術(shù)的公司而言,微軟現(xiàn)在正在做一些它很久未在 AI 領(lǐng)域做過(guò)的事:按照自己的時(shí)間表、以自己的價(jià)格、交付自己的工作——并挑戰(zhàn)市場(chǎng)跟上。(本文首發(fā)鈦媒體 APP,作者 | 硅谷 Tech_news,編輯 | 秦聰慧)

相關(guān)標(biāo)簽

相關(guān)閱讀

最新評(píng)論

沒(méi)有更多評(píng)論了

覺(jué)得文章不錯(cuò),微信掃描分享好友

掃碼分享

熱門推薦

查看更多內(nèi)容

企業(yè)資訊

查看更多內(nèi)容