1.6 萬億規(guī)模,用的 GPU 只有同行四分之一,存儲占用十分之一,推理成本被壓得很低。
這不是某個實驗室里擺拍的數據海報,也不是發(fā)布會燈光下那種 " 聽起來很厲害、落地又很遙遠 " 的口號。真正讓科技圈炸鍋的地方在于:當別人還在拼誰的模型更強,DeepSeek 這次像是直接去掀桌子,瞄準的不是榜單,是賬本。
這兩天,盯著科技圈的人幾乎都被同一條消息反復刷屏。DeepSeek 一口氣放出 V4 Flash 和 V4 Pro。公開測試結果擺在那里,推理能力直接對標 GPT-4、Gemini Pro,編程實測壓過 Claude Sonnet 4.5,離 Opus 4.6 只差一截。
但更讓人坐不住的,不是 " 能打 ",而是 " 怎么打到這個程度的 "。很多人第一反應不是歡呼,而是盯著那串參數發(fā)愣。因為這不是普通意義上的模型升級,更像是有人突然告訴你:同樣跑一場比賽,別人車隊開滿整個賽道,你這邊只出四分之一的車,油耗還低得離譜,成績居然還沒掉隊。
說白了,這事刺痛行業(yè)的點特別現實。
過去兩年,做大模型的人都知道,最難的從來不只是把模型訓出來。難的是,模型能訓練,錢卻扛不住。 訓練一次動輒幾千萬美金,推理成本高到企業(yè)客戶聽完報價就開始沉默。老板在會上問一句 " 效果有沒有明顯提升 ",技術團隊還沒來得及解釋,財務已經開始皺眉。
很多公司不是不想用最好的模型,是根本用不起。
于是這次評論區(qū)吵得最兇的,不是哪個 benchmark 又贏了幾分,而是那句真正帶火藥味的話:這是不是意味著,大模型的成本結構要變天了?
為什么大家會這么激動?
因為如果只看成績,V4 系列仍然可以被歸到 " 頂尖選手繼續(xù)內卷 " 的范疇里。今天你追上 GPT-4,明天他拉高一點,后天 Gemini 再補一刀??礋狒[的人覺得刺激,做產品的人其實早就有點麻木了。
真正讓行業(yè)心里一震的,是它動了底層。
V4 系列沒有繼續(xù)走英偉達 CUDA 的老路,而是遷移到華為昇騰 950,底層從 CUDA 架構重寫到 CANN 平臺。很多非技術用戶聽到這里,容易覺得這只是 " 換了個技術名詞 "。但在業(yè)內,這個動作不亞于把原來所有車都在跑的高速公路,換成了一條新修的路,而且這條路不光能跑,速度還沒慢多少。
這就不是簡單的 " 兼容一下 " 了。
CUDA 過去為什么這么強?不是因為它只是個工具,而是因為它背后綁著整套生態(tài)。工程師學的是它,代碼寫的是它,教程圍著它轉,社區(qū)討論的問題也都在它上面。你遇到 bug,網上一搜,十有八九有人踩過坑。它像一座超級成熟的大城市,餐館、醫(yī)院、地鐵、學校全齊了,大家住久了,自然不愿意搬家。
現在 DeepSeek 做的事,相當于告訴全行業(yè):別急著認定全世界只能住這一座城。
華為這邊也確認了,昇騰 950 的超節(jié)點不是實驗室演示,不是會場里放出來的那種 " 概念視頻 ",而是已經批量部署。換句話說,這不是 PPT,是能連續(xù)跑業(yè)務的系統(tǒng)。
因為過去很多 " 替代方案 " 都卡在一個尷尬階段:能演示,不能大規(guī)模干活;能跑 demo,不能撐住業(yè)務峰值;能讓投資人鼓掌,不能讓甲方安心簽單。行業(yè)嘴上都說要多元化,真到生產環(huán)境里,又老老實實回到熟悉的那條路。
而這次,氣氛開始變了。
時間點也很微妙。距離上一代版本過去 15 個月,算下來就是 2025 年 4 月前后上線。放在這兩年的背景里,這不是一個普通更新時間。因為就在這段時間里,算力供應、出口限制、成本壓力一層壓一層,幾乎所有做 AI 的團隊都被現實教育過一遍。
模型能力當然重要,但商業(yè)世界里更殘酷的問題永遠是:能不能算得過來。
想象一下一個真實場景。
一家做企業(yè)服務的 AI 公司,技術負責人想上更強模型,因為客戶天天追問效果。銷售也著急,因為競品已經拿 " 智能化升級 " 當宣傳語了。結果財務拿著預算表一看,訓練和推理成本像開了閘的水,項目還沒放量,利潤先被沖沒了。老板坐在會議室里沉默幾秒,最后大概率只問一句:有沒有次優(yōu)但便宜很多的方案?
以前,這句問話經常把技術團隊問死。
因為所謂 " 次優(yōu)方案 ",往往意味著性能掉得明顯,體驗差得明顯,最后用戶一用就知道不是同一檔貨??涩F在,如果真能把 GPU 數量砍到四分之一,成本降七成以上,事情就完全不一樣了。那不只是技術選型問題,而是商業(yè)決策邏輯會被改寫。
你會發(fā)現,采購會議上的空氣都不一樣了。
過去大家討論的是 " 能不能買到更多高端卡 "?,F在可能變成 " 如果備選方案也能跑,而且更便宜,我們?yōu)槭裁床涣粢皇郑? 這不是誰背叛誰,而是每家公司都會做的正常計算題。
國外的反應就很耐人尋味。
英偉達 CEO 在播客里的那番話,很多人聽完都品出味來了。他真正擔心的,未必是誰又做出一個強模型。因為強模型這幾年層出不窮,追來追去是常態(tài)。真正讓人警覺的,是有人開始繞開 CUDA。
因為 CUDA 才是英偉達真正的護城河。
卡可以被追,價格可以被比,產品周期也能被壓縮,但生態(tài)這種東西最難撬。它像一張巨大的網,把開發(fā)者、工具鏈、文檔、社區(qū)經驗、培訓體系全都綁在一起。過去美國限制高端 GPU 出口,本質上也是希望把節(jié)奏拖慢,至少讓后來者在算力這件事上別跑太快。
如果模型已經能在國產芯片上高效跑通,禁令的邊際效果自然會下降。不是說原有體系一下子就失效了,而是那種 " 只此一家 " 的壓迫感開始松動。當一家企業(yè)發(fā)現,原來第二套方案不僅存在,還能用,甚至在成本上更友好,那它心里的算盤肯定會重新撥一遍。
這時候,話語權就不再只掌握在唯一標準手里。
國內的變化更直接,甚至不用看長遠,只看眼下就能感受到風向變了。調用量已經是美國的四倍以上,算力需求是真實存在的,而且是每天都在往上拱的那種真實。需求在這兒,成本壓力也在這兒,誰能把這兩件事同時接住,誰就有資格坐上牌桌中央。
以前,懂 CUDA 的工程師走到哪都吃香。
現在,熟悉 CANN、能調昇騰性能的人開始被搶。這個變化表面看是招聘市場的小波動,實際上很能說明問題。技術生態(tài)從來不是靠口號長出來的,它一定是先有人干活,再有人總結經驗,再有人寫教程,最后形成一整套 " 后來者也能快速進場 " 的方法。
誰在一線部署,誰在優(yōu)化參數,誰在解決推理卡頓,誰就掌握話語權。
這也是為什么 DeepSeek 這一步,會讓很多人突然意識到:原來 " 標準 " 這件事,不一定永遠只有一個答案。以前大家默認全世界只有一條主路,繞路就意味著性能差、效率低、踩坑多?,F在第一次有人把另一條路修得像模像樣,還開上去了。
這種沖擊,不在于一兩次測試,而在于開發(fā)者心態(tài)開始松動。
別小看 " 心態(tài)松動 " 這四個字。
任何生態(tài)真正被撼動,往往都不是因為某個性能指標突然多了 3 分、5 分,而是因為越來越多人開始問一句:除了原來的方案,我是不是還有別的選擇?
一旦這個問題被問出來,市場就會變得不一樣。
DeepSeek 把模型開放給所有人用,但針對昇騰做了深度優(yōu)化,這個動作本身就像一塊試金石。它不保證全球格局立刻翻面,卻很扎實地證明了一件事:頂級模型未必只能依附單一架構。
這句話看著平靜,實際上分量很重。
因為它觸碰到的是過去幾年 AI 產業(yè)最深的一層默契:最強模型、最強算力、最成熟生態(tài),似乎天然應該綁定在一起。誰想拆開,誰就容易被當成 " 不現實 "??蛇@次,至少已經有人把 " 理論上可行 " 往前推到了 " 工程上能跑 " 的階段。
如果昇騰 950 下半年真的大規(guī)模上市,成本再壓一輪,那這個選擇題就不會只留在中文互聯網里吵了。到那時,擺在全球開發(fā)者面前的,將是一個非常實際、也非常不舒服的問題:繼續(xù)留在熟悉的 CUDA 體系里,享受成熟生態(tài)的便利;還是嘗試新的 CANN 生態(tài),換取成本和自主性的另一種可能?
這不是技術理想主義的爭論。
這是每個團隊都可能遇到的日??絾枴D阋阅?,要穩(wěn)定,要成本,還要交付時間?,F實從來不允許你只選一個。很多管理者嘴上說 " 我們要最先進的 ",真正到簽預算的時候,手卻會停在 " 綜合成本 " 那一欄很久。
所以這次 DeepSeek 激起的,不只是技術圈的好奇,更是一種很復雜的情緒。
有人興奮,因為終于看到替代路線跑出來了。
有人焦慮,因為自己熟悉的規(guī)則可能要變。
有人嘴硬,說這還遠遠談不上顛覆。
也有人已經偷偷開始研究,怎么把團隊里的人往新生態(tài)上帶一點。
說到底,行業(yè)里真正值錢的從來不只是參數,而是誰能把參數背后的成本、效率和生態(tài)一起打包解決。單看模型強不強,故事永遠講不完;但一旦牽扯到賬怎么算、卡怎么買、人怎么招、系統(tǒng)怎么跑,所有宏大敘事都會瞬間落地,變成老板和工程師都繞不過去的硬題。
而這一次,DeepSeek 丟出來的,恰恰就是這么一道硬題。
當 " 備選方案 " 不再只是備胎,當第二套標準真的能撐起頂級模型,誰還敢說 AI 世界的通行證,永遠只能由一家來發(fā)?