电竞比分网-中国电竞赛事及体育赛事平台

關(guān)于ZAKER Skills 合作
新行情 17小時(shí)前

DeepSeek 聯(lián)手華為,黃仁勛最擔(dān)心的事發(fā)生了

英偉達(dá)獨(dú)大的日子要一去不返了。

出品 | 新行情 作者 | 李新

"DeepSeek 如果選擇在華為芯片上完成首發(fā),對(duì)美國來說將是一場災(zāi)難。"

這話是英偉達(dá) CEO 黃仁勛不久前在公開場合親口說的。

這番話背景是,DeepSeek 已經(jīng)提前好幾周在跟華為做軟件適配和優(yōu)化,新一代旗艦?zāi)P?DeepSeek V4 轉(zhuǎn)向了華為昇騰 AI 芯片。

在此之前,DeepSeek 一直用的是英偉達(dá)的芯片,底層跑的也是英偉達(dá)主導(dǎo)的 CUDA 平臺(tái)。

這次切換,意味著 " 國產(chǎn)最強(qiáng)模型 " 加上 " 國產(chǎn)自主算力 " 這套組合,正式拉出來實(shí)戰(zhàn)了。

因此,黃仁勛說這話的時(shí)候,大概心里已經(jīng)有了不好的預(yù)感。

然而僅僅過了九天,華為昇騰官方就宣布,DeepSeek V4 在昇騰平臺(tái)完成首發(fā)適配。

黃仁勛的噩夢(mèng),還是成真了。

DeepSeek 遇上華為,新一代大模型來了

上周五,DeepSeek V4 正式發(fā)布并開源。這次發(fā)布最讓人關(guān)注的,除了模型能力的大幅提升,還有一個(gè)關(guān)鍵信息:它是第一個(gè)在華為昇騰 NPU 上完成首發(fā)的萬億參數(shù)級(jí)大模型。

先來看看這個(gè)新模型本身。

這次發(fā)布了兩個(gè)版本,旗艦版叫 V4-Pro,輕量版叫 V4-Flash。兩個(gè)版本都支持 100 萬 token 的超長上下文,并且采用 MIT 協(xié)議完全開源。

架構(gòu)方面,DeepSeek V4 采用了混合專家架構(gòu),同時(shí)引入了混合注意力機(jī)制,通過 token 維度的壓縮技術(shù),KV 緩存的內(nèi)存占用比上一代降低了大約 90%。

也就是說,在百萬上下文這種極端場景下,每個(gè) token 的算力消耗只有 V3.2 的 27%。

在 Agent 能力、數(shù)學(xué)推理、代碼生成這些核心指標(biāo)上,V4 都達(dá)到了開源模型的領(lǐng)先水平,拿出來跟全球頂級(jí)的閉源模型比,也不落下風(fēng)。

圖源:油管

價(jià)格方面,下手更狠。

V4-Flash 的定價(jià)是輸入 1 元每百萬 token,輸出 2 元;V4-Pro 輸入 12 元,輸出 24 元。

與同期 OpenAI 的 GPT-5.5 來對(duì)比一下,它的輸出定價(jià)是 30 美元每百萬 token。換算下來,兩邊差了一百多倍。

能把價(jià)格壓到這個(gè)程度,本質(zhì)上靠的是技術(shù)突破。

DeepSeek 在模型架構(gòu)上做了大量創(chuàng)新,剛才提到的混合注意力機(jī)制和 token 壓縮技術(shù),讓推理時(shí)的內(nèi)存占用和計(jì)算量都大幅下降。

同時(shí),混合專家架構(gòu)配合細(xì)粒度的專家并行策略,讓模型可以根據(jù)任務(wù)需求動(dòng)態(tài)調(diào)用部分算力資源,不用每次把整個(gè)模型都跑滿,避免了大量無效計(jì)算。

再加上訓(xùn)練和推理環(huán)節(jié)針對(duì)國產(chǎn)硬件做了深度優(yōu)化,整體效率提升非常明顯。

所以與其說這是在打價(jià)格戰(zhàn),不如說這是技術(shù)進(jìn)步帶來的成本結(jié)構(gòu)變了。

圖源:投資界

在官方技術(shù)報(bào)告中,有這樣一句話:" 我們?cè)谟ミ_(dá) GPU 和華為昇騰 NPU 兩個(gè)平臺(tái)上均驗(yàn)證了細(xì)粒度 EP(專家并行)方案。"

這種事放在以前,是很難想象的。一個(gè)萬億參數(shù)級(jí)別的頂級(jí)大模型,頭一回在全球范圍內(nèi)徹底跑通了英偉達(dá) CUDA 之外的生態(tài)路徑。

圖源:微博

還有一個(gè)細(xì)節(jié)值得注意。V4 發(fā)布前,DeepSeek 沒有像往常那樣提前把模型給到英偉達(dá)和 AMD 做適配,而是打破慣例,讓華為提前好幾周就開始做軟件優(yōu)化。

態(tài)度的轉(zhuǎn)變,已經(jīng)很明顯了。

不過這也不是臨時(shí)起意。

DeepSeek V3.1 發(fā)布的時(shí)候,特意支持了一個(gè)叫 UE8M0 FP8 的數(shù)據(jù)格式,官方當(dāng)時(shí)明確說了,這個(gè)格式是為 " 即將發(fā)布的下一代國產(chǎn)芯片 " 準(zhǔn)備的。

換句話說,DeepSeek 至少在一年前就開始為這次轉(zhuǎn)向鋪路了。

"DeepSeek 時(shí)刻 ",又一次出現(xiàn)了

2025 年初,DeepSeek R1 模型發(fā)布,整個(gè)行業(yè)都被震了一下。

一家中國 AI 初創(chuàng)公司以極低成本,實(shí)現(xiàn)了比肩美國頂尖大模型性能的事實(shí),從而徹底顛覆了 "AI 研發(fā)必須燒錢 " 的行業(yè)共識(shí)的時(shí)刻。

因此,全球科技與金融界也將此命名為 "DeepSeek 時(shí)刻 "。

而這次,DeepSeek 搭上了華為芯片,靠架構(gòu)優(yōu)化在國產(chǎn)算力平臺(tái)上跑出了亮眼的性能。

從某種意義上說,這或許可以看作是又一個(gè) "DeepSeek 時(shí)刻 "。

DeepSeek 為什么會(huì)投入時(shí)間研發(fā)適配華為芯片的架構(gòu)?原因不難理解。

首先是美國對(duì)我國高端 GPU 的出口管制越來越緊。

A100 和 H100 基本上斷供了,英偉達(dá)專門給中國市場定制的 " 閹割版 "H800,后來也一步步被收緊。

去年年中,H20 芯片在中國內(nèi)地一度供應(yīng)短缺,直接拖慢了 DeepSeek R2 模型的開發(fā)進(jìn)度。

對(duì)一家做 AI 大模型的公司來說,最要命的不是對(duì)手有多強(qiáng),而是你根本不知道手上的芯片供應(yīng)能撐到哪一天。供應(yīng)鏈就是命脈,命脈攥在別人手里,這就不是技術(shù)問題了,是生存問題。

所以 DeepSeek 轉(zhuǎn)向華為,與其說是一次主動(dòng)的戰(zhàn)略選擇,不如說是一道必須做的生存題。英偉達(dá)的芯片再強(qiáng),當(dāng)它變成一把懸在頭頂?shù)膭r(shí),性能再好也不如供應(yīng)穩(wěn)定來得踏實(shí)。

其次,華為在芯片這個(gè)領(lǐng)域確實(shí)扎得夠深。

這次跟 DeepSeek V4 搭檔的,是昇騰 950PR。搭載這款芯片的 Atlas 350 加速卡,單卡 FP4 算力達(dá)到 1.56P,是英偉達(dá) H20 的 2.87 倍。

而且,這是目前國內(nèi)唯一支持 FP4 精度的推理產(chǎn)品。

因?yàn)槭艿街撇?,華為拿不到最先進(jìn)的芯片制程工藝,單顆昇騰芯片的算力確實(shí)還追不上英偉達(dá)的旗艦產(chǎn)品。

但華為換了一個(gè)打法,走的是 " 超節(jié)點(diǎn)加集群 " 的路線,把多顆芯片高效地連在一起,用系統(tǒng)集成的力量來彌補(bǔ)單顆芯片的差距。

簡單說就是,單個(gè)打不過,那就群毆。

市場反應(yīng)也很能說明問題。

IDC 數(shù)據(jù)顯示,2025 年中國市場 AI 加速卡總出貨量大概 400 萬張。英偉達(dá)雖然還排在第一,大概 220 萬張,但市場份額已經(jīng)從制裁前的 95% 跌到了 55%。

三年時(shí)間,丟了 40 個(gè)百分點(diǎn)。

國產(chǎn) AI 加速卡出貨 165 萬張,市場份額約 41%,其中華為一家就占了約 81.2 萬張,拿下國產(chǎn)陣營的半壁江山,整體市場份額大概 20%。

格局已經(jīng)變了。英偉達(dá)不再是唯一的選擇,華為正在逐漸變成主選項(xiàng)之一。

格局變了,AI 的故事才剛剛開始

黃仁勛在行業(yè)里一向說話很直,他對(duì) DeepSeek 和華為態(tài)度的變化,很能說明問題。

去年年中他訪華的時(shí)候,在媒體會(huì)上公開夸 DeepSeek,說 R1 這個(gè)架構(gòu)很創(chuàng)新、很革命性,是世界上第一個(gè)開源的推理模型,每個(gè) token 的算力消耗比其他模型低很多。

當(dāng)時(shí)被問到華為芯片能不能替代英偉達(dá),他也坦率承認(rèn):" 這只是時(shí)間問題。我們做了三十年,他們才做了幾年,但華為已經(jīng)能夠證明自己有多強(qiáng)大了。"

到了去年底,他的調(diào)子變了,開始帶有警告的意味。

他公開說," 中國市場的地位無可替代,我們不應(yīng)該把整個(gè)市場拱手讓人,應(yīng)該主動(dòng)參與競爭。" 但事情或許已經(jīng)不是他能左右的了。

等到 V4 發(fā)布前不到十天,他的表態(tài)逐漸轉(zhuǎn)向了悲觀。

他直言,如果頂尖 AI 模型被優(yōu)先優(yōu)化用于華為芯片而不是英偉達(dá)平臺(tái)," 對(duì)我們而言將是災(zāi)難性的 "。

圖源:差評(píng)

這句話里,大概已經(jīng)透露出他看到了某種正在靠近的未來。

DeepSeek 跟華為這次的聯(lián)手,還釋放了一個(gè)更深層的信號(hào)。未來的 AI 競爭,正在從企業(yè)跟企業(yè)之間的比拼,變成生態(tài)跟生態(tài)之間的角力。

這次事件說明,當(dāng)外部壓力足夠大的時(shí)候,一個(gè)市場完全可以孵化出一整套不依賴西方技術(shù)的算力閉環(huán),從芯片測試到模型部署,從底層代碼到商業(yè)應(yīng)用,整個(gè)鏈條正在快速閉合。

這也能解釋為什么華盛頓那邊反應(yīng)那么激烈。

V4 發(fā)布當(dāng)天,美國國務(wù)院就給全球使館發(fā)了外交電報(bào),指控 DeepSeek 等中國 AI 公司涉嫌 " 竊取知識(shí)產(chǎn)權(quán) " 和 " 模型蒸餾 "。

當(dāng)一個(gè)市場開始用自己的腿走路時(shí),原來制定規(guī)則的一方會(huì)突然發(fā)現(xiàn),手里的牌好像沒那么多了。

而當(dāng)中國用自己的芯片跑起了自己的頂尖模型,這場 AI 競賽的下半場,或許才算真正開始。

點(diǎn)關(guān)注,跟主編交個(gè)朋友 ↓↓↓

商務(wù)合作請(qǐng)聯(lián)系 QQ/ 微信:18576718939

相關(guān)閱讀

最新評(píng)論

沒有更多評(píng)論了

覺得文章不錯(cuò),微信掃描分享好友

掃碼分享

熱門推薦

查看更多內(nèi)容

企業(yè)資訊

查看更多內(nèi)容