电竞比分网-中国电竞赛事及体育赛事平台

關于ZAKER Skills 合作
大眾日報 7小時前

不“畫餅”的 DeepSeek, 用 2 分錢改寫 AI 玩法

百萬 Token(詞元),相當于一個中型公司的全部代碼庫。如今,DeepSeek 把處理這么多信息的成本,變成了 2 分錢。

4 月 24 日,DeepSeek-V4 系列預覽版發(fā)布,同步開源 V4-Pro 與 V4-Flash 兩款模型,標配百萬 Token 超長上下文。但更令行業(yè)在意的,是隨后 25 日與 26 日的連環(huán)降價:先是 V4-Pro 限時 2.5 折,再是全系 API 輸入緩存命中價格永久降至首發(fā)價的十分之一。兩次調(diào)價之后,V4-Flash 每百萬上下文輸入緩存命中價格僅 0.02 元,V4-Pro 為 0.025 元——全球大模型價格的新谷底,被重新定義。

這不僅是一次簡單的版本迭代,更不是隨意打響的 " 價格戰(zhàn) "。它意味著,一家中國 AI 公司,正在用技術提升效率、用開源重塑規(guī)則、用國產(chǎn)算力構建獨立生態(tài)。

當處理百萬 Token 的成本被壓縮到可以忽略不計,其帶來的連鎖反應,就是從芯片到應用的全產(chǎn)業(yè)鏈,都將被重新定義價值。

坦承 " 打不過 ":

比肩頂級的自信與清醒

DeepSeek-V4 的模型分為 V4-Pro 和 V4-Flash 兩個版本,可以理解為 Pro 是專家模式,F(xiàn)lash 是快速模式。

DeepSeek 官方發(fā)布的技術報告顯示,V4-Pro 的 Agent 能力大幅提高,擁有豐富的世界知識和世界頂級推理性能,性能比肩頂級閉源模型。

值得注意的是,在技術報告中,DeepSeek 罕見地給出了精確且坦誠的自我評價:V4-Pro 使用體驗優(yōu)于 Sonnet 4.5,交付質(zhì)量接近 Opus 4.6 非思考模式,但仍與 Opus 4.6 思考模式存在一定差距。

翻譯過來就是:我們的模型比對手的中端產(chǎn)品好用,接近對手不開思考模式的高端產(chǎn)品,但打不過對手最強產(chǎn)品的最強模式。

承認自己不如對手,在商業(yè)上是一件需要勇氣的事,但更是一種比肩頂級的自信與清醒。

在 AI 這個技術爆炸的領域,Anthropic 的 Opus、OpenAI 的 GPT、Google 的 Gemini 都在進化。DeepSeek 作為追趕者或并跑者,存在差距是正常的。但當一個中國開源模型愿意公開、精確、平和地談論這個差距,這種態(tài)度傳遞出三個信號:對自己技術的自信,對用戶智商的尊重,以及堅守長期主義的定力。

這不是 " 挑戰(zhàn)者 " 的姿態(tài),而是 " 競爭者 " 的自覺。在熱衷于 " 講故事 "" 畫餅 " 的全球 AI 市場,這種坦誠,本身就是核心競爭力。

" 白菜價 " 背后:

技術與電力構筑的護城河

承認 " 打不過 " 業(yè)內(nèi)頂尖高手的 DeepSeek,又憑什么把價格 " 打 " 到全球最低?

答案不在資本燒錢補貼,而在底層架構的創(chuàng)新。

傳統(tǒng)模型處理長上下文時,計算量會呈爆炸式增長。而 V4 開創(chuàng)了一種全新的注意力機制,通過 Token 壓縮結合 DSA 稀疏注意力,花更少的算力和顯存,實現(xiàn)了全球領先的長上下文能力。

DeepSeek 的技術報告給出了這次架構改動的幅度:與上一代 V3.2 相比,在百萬 Token 上下文場景下,V4-Pro 的推理計算量只需 27%,KV 緩存只需 10%;V4-Flash 的推理計算量降至 10%,KV 緩存降至 7%。

通俗地說,過去跑一條百萬字上下文需要 3 臺機器的算力,現(xiàn)在一臺機器就能從容應對,內(nèi)存開銷僅是過去的 1/10。

效率飛躍的核心,是 DeepSeek 技術報告中披露的 " 混合注意力架構 "。簡單來說,這套機制就像讀長篇小說時,既關注段落細節(jié),又把握全書脈絡,同時還記著剛剛翻過的幾頁。三者配合,既省力,又不漏重點。

技術創(chuàng)新提高效率,效率提升兌現(xiàn)成本——這是 DeepSeek 敢于連續(xù)降價的底氣。

僅有算法還不夠。就像自來水公司不僅要有凈化技術,還要有遍布全城的水管網(wǎng)絡。AI 算力是典型的耗電大戶,訓練和推理需要大量電力持續(xù)供應。中國龐大而穩(wěn)定的供電網(wǎng)絡,構成了 AI 產(chǎn)業(yè)背后最堅實的 " 護城河 "。

當前的美國 AI 浪潮,正走向不可逆轉的精英化與貴族化,算力正成為少數(shù)人才能消費的數(shù)字特權。而中國選擇了另一條道路:開源、低價,讓最先進的 AI 能力像水電一樣便宜、可靠,讓普通老百姓也用得起。

擺脫依賴:

" 科技平權 " 的中國式回答

在 DeepSeek 公告價格表中,還有一行不易被注意到的灰色小字:受限于高端算力,目前 Pro 的服務吞吐十分有限,預計下半年昇騰 950 超節(jié)點批量上市后,Pro 的價格會大幅下調(diào)。

這條備注的含金量,并不亞于模型本身。

為什么昇騰 950 超節(jié)點能把價格 " 打下來 "?答案藏在 DeepSeek 的技術報告里——華為昇騰 NPU 與英偉達 GPU 被寫進了同一份硬件驗證清單:" 我們在英偉達 GPU 和華為昇騰 NPU 兩個平臺上均驗證了細粒度 EP(專家并行)方案,在通用推理任務中實現(xiàn) 1.50 至 1.73 倍加速;在延遲敏感場景下最高達到 1.96 倍。"

這是萬億參數(shù)級別的模型,首次在正式文檔中完成了對國產(chǎn) AI 芯片的 " 官方認定 " 。

昇騰 950 超節(jié)點通過架構升級實現(xiàn)高吞吐、低時延推理,讓昇騰芯片能以極低成本支撐長上下文大模型商用。目前,至少 8 家國產(chǎn) AI 芯片廠商 " 發(fā)布即適配 "DeepSeek-V4,證明國產(chǎn)算力足以承載萬億參數(shù)商業(yè)運行。

這背后的邏輯,遠比降價更為深遠。" 頂尖算法 + 自主芯片 ",中國 AI 產(chǎn)業(yè)正在構建一個擺脫單一硬件依賴的自主路徑。DeepSeek 已經(jīng)證明了前半程,華為昇騰則負責完成后半程的產(chǎn)能與規(guī)?;?。

在發(fā)布公告末尾,DeepSeek 援引《荀子 · 非十二子》中的一句話回應當下處境:" 不誘于譽,不恐于誹,率道而行,端然正己。"

當行業(yè)狂飆突進、資本喧囂不止,一家中國 AI 公司用 0.02 元的價格,為 " 科技平權 " 寫下了一個中國式的回答。

(本文引用數(shù)據(jù)均來自 DeepSeek 技術報告及官方定價頁面)

(大眾新聞記者 黃露玲)

相關標簽

覺得文章不錯,微信掃描分享好友

掃碼分享

熱門推薦

查看更多內(nèi)容

企業(yè)資訊

查看更多內(nèi)容