
回顧 DeepSeek 的發(fā)展軌跡,這種轉(zhuǎn)變顯得尤為意味深長。在過去兩年中,當整個中國 AI 行業(yè)都在瘋狂融資、擴張、講生態(tài)故事時,DeepSeek 反而在做一種刻意的收縮——不對外發(fā)聲,不頻繁發(fā)產(chǎn)品,不參與大廠敘事,甚至對資本保持距離。創(chuàng)始人梁文鋒從公司成立第一天就劃了一條清晰的紅線:不接受外部融資,不稀釋股權(quán),不被任何人的商業(yè)化時間表綁架。他想打造的更像一個純粹的研究機構(gòu),追逐 AGI(通用人工智能)、堅持開源、讓技術(shù)本身說話。
理想主義者的現(xiàn)實主義轉(zhuǎn)身
要理解 DeepSeek 為何在此時融資,首先得回顧它為何長期拒絕融資。
DeepSeek 由量化對沖基金幻方量化的創(chuàng)始人梁文鋒于 2023 年創(chuàng)立。在此之前,幻方用多年的量化交易利潤為 DeepSeek 提供了持續(xù)的資金 " 輸血 "。公司股權(quán)結(jié)構(gòu)極為集中,梁文鋒直接和間接持有 84.29% 的股份,并擁有幾乎 100% 的表決權(quán)。
這種 " 不差錢 " 的底氣,讓梁文鋒得以堅守一種近乎理想主義的發(fā)展哲學:拒絕資本的短視干擾,專注打磨基礎(chǔ)模型,追求實現(xiàn) AGI 的技術(shù)上限。
聯(lián)想創(chuàng)投高級合伙人宋春雨曾透露,自己早在 2024 年 2 月就與梁文鋒深入交流,但對方明確表示不融資。" 梁文鋒對商業(yè)化不感興趣,他專注打磨基礎(chǔ)模型,確保每一代模型都保持領(lǐng)先。" 另有報道稱,梁文鋒曾拒絕來自騰訊和阿里巴巴等科技巨頭的合作機會,擔心外部投資者會干預公司決策。
這一定位讓 DeepSeek 在早期創(chuàng)業(yè)公司中顯得格外另類。當其他大模型創(chuàng)業(yè)公司在 2023-2024 年瘋狂融資、高調(diào)亮相時,DeepSeek 像一個隱士般潛心研發(fā),直至 V3 和 R1 的橫空出世才讓世界注意到它的存在。
然而,這種 " 不缺錢 " 的自信在 2026 年初出現(xiàn)了明顯裂縫。最直接的信號來自人才流失。2025 年底至 2026 年初,DeepSeek 多名核心研發(fā)骨干相繼出走:V3 架構(gòu)關(guān)鍵開發(fā)者羅福莉轉(zhuǎn)投小米接手 MiMo 大模型團隊;第一代大語言模型核心作者王炳宣去了騰訊;多模態(tài)方向核心研究員阮翀加入元戎啟行;OCR 系列核心作者魏浩然也在今年春節(jié)前后離開。
更致命的是期權(quán)問題。DeepSeek 從未融資,沒有市場化的估值錨點。公司給核心成員的股權(quán)承諾,拿到手里無法換算成真金白銀。大廠的期權(quán)有行權(quán)價、有內(nèi)部回購機制、有 IPO 預期。外界只知道 DeepSeek 很值錢,但到底值多少,沒有人能說清,員工更不知道。
而這些原因似乎也預示著 DeepSeek 的融資只是遲早的事。
多重壓力下的必然選擇
DeepSeek 的融資轉(zhuǎn)折并非單一因素驅(qū)動,而是多重壓力交織下的必然結(jié)果。這些壓力來自技術(shù)迭代、算力需求、市場競爭和戰(zhàn)略節(jié)奏等多個維度,共同構(gòu)成了梁文鋒不得不面對的現(xiàn)實困境。
技術(shù)迭代的沉重包袱是首要壓力。下一代旗艦模型 V4 的發(fā)布一再推遲,原本定在春節(jié)前后發(fā)布,推到 2 月,再推到 3 月,目前的口徑是 4 月下旬。從公開信息來看,延期背后至少有三層原因交織:技術(shù)路線本身發(fā)生質(zhì)變、身份包袱壓力、國產(chǎn)芯片深度適配的挑戰(zhàn)。V4 要做的已經(jīng)不再是一個刷 benchmark 的基礎(chǔ)模型,而是萬億參數(shù) MoE 架構(gòu)、原生多模態(tài)、百萬 token 上下文、全新的 Engram 條件記憶機制的系統(tǒng)級工程,訓練驗證復雜度陡然上了一個臺階。
更深層的壓力來自身份包袱。DeepSeek 立身靠的是 " 十分之一成本做到頂級 " 這個故事。V4 如果只是性能微增卻推高了推理成本,支撐估值和聲譽的故事就會出現(xiàn)裂痕。某種程度上,一個不夠驚艷的 V4,反而不如不發(fā)。
此外,國產(chǎn)芯片的深度適配成為獨立巨型工程。多方信源在 4 月初披露,V4 將全面運行在華為昇騰 950PR 芯片上,有望成為首個完全跑在國產(chǎn)算力上的旗艦大模型。戰(zhàn)略價值極高,但這本身直接吃掉了大量研發(fā)帶寬。
到 2026 年 4 月,DeepSeek 已有 15 個月沒有大版本更新。而這期間,OpenAI 迭代四五輪,Anthropic 連推 Claude 4.5/4.6/4.7,國內(nèi)同行如智譜、月之暗面、字節(jié)也在應用層狂飆突進。所有人都在加速,只有 DeepSeek 靜悄悄。
梁文鋒本人也曾坦言國產(chǎn) AI 模型訓練效率的差距:" 我們估計,國內(nèi)最好的水平和國外最好的相比,模型結(jié)構(gòu)和訓練動力學上可能有一倍的差距,光這一點我們要消耗兩倍的算力才能達到同樣效果。另外數(shù)據(jù)效率上可能也有一倍差距,也就是我們要消耗兩倍的訓練數(shù)據(jù)和算力,才能達到同樣的效果。合起來就要多消耗 4 倍算力。" 這種客觀存在的技術(shù)差距,使得 DeepSeek 在追求技術(shù)領(lǐng)先的同時,必須面對更高的算力成本。
值得注意的是,在 R1 爆紅后,DeepSeek 的用戶量和并發(fā)請求量呈指數(shù)級增長,對算力基礎(chǔ)設施的需求急劇攀升。2026 年初,DeepSeek 甚至經(jīng)歷了一場大規(guī)模服務中斷,網(wǎng)頁端與 App 全面卡頓,"DeepSeek 崩了 " 相關(guān)話題迅速沖上多個平臺熱搜。
與此同時,巨頭們正在以 " 千億級 " 規(guī)模加碼算力基建。阿里巴巴宣布未來三年投入 3800 億元建設云和 AI 硬件基礎(chǔ)設施;字節(jié)跳動 2025 年資本開支計劃高達 1500 億元,同比大增 88%。相比之下,靠母公司幻方量化的資金支撐已明顯力不從心。
此外,前文提到的核心團隊頻頻被大廠高薪挖走,也造成了 DeepSeek 不得不獲取更多的錢,來留住現(xiàn)有的團隊,保持技術(shù)競爭力,畢竟在這個 AI 人才稀缺的當下,大廠對 AI 人才的需求與現(xiàn)有的人才供應差距很大。如果沒有足夠有吸引力的 " 未來 "(包括薪資、股權(quán)等),是留不住人才的,這點從過去兩年 AI 人才市場的流動趨勢已經(jīng)可以看出。
融資后的 DeepSeek" 路在何方 "?
若 DeepSeek 成功獲得外部融資,這筆資金將為其在技術(shù)研發(fā)、市場拓展和商業(yè)變現(xiàn)等多個關(guān)鍵領(lǐng)域注入強大動力,進而對整個 AI 行業(yè)格局產(chǎn)生深遠影響。然而,融資只是開始,DeepSeek 面臨的挑戰(zhàn)依然嚴峻。
技術(shù)研發(fā)的深度與廣度拓展將是融資后的首要方向。DeepSeek 有望利用融資資金進一步加大對人工智能技術(shù)的研發(fā)投入。一方面,公司可能會持續(xù)優(yōu)化現(xiàn)有模型,不斷提升其性能和智能化水平。另一方面,DeepSeek 可能會加大對前沿技術(shù)的研究探索,如具身智能、AI Agent 生態(tài)等領(lǐng)域。
這個過程中,其 V4 模型發(fā)布后,業(yè)界的反響將成為關(guān)鍵考驗。據(jù)報道,DeepSeek V4 大模型將徹底重構(gòu)技術(shù)架構(gòu),核心引入 mHC(多路殘差混合連接)與 Engram(AI 記憶模塊)兩項黑科技,聚焦代碼生成、推理效率與邊緣部署三大能力,技術(shù)路徑從 " 堆參數(shù) " 轉(zhuǎn)向 " 雙軸稀疏 + 記憶 - 計算分離 "。市場預計,DeepSeek 新模型訓練成本再降 50%,若實現(xiàn)完全開源或?qū)⑼苿有袠I(yè) API 價格減少 60%。這將是 DeepSeek 證明自己依然保持技術(shù)領(lǐng)先優(yōu)勢的重要機會。
市場拓展的全球化布局是第二戰(zhàn)略重點。憑借充足的資金,DeepSeek 將有能力在全球范圍內(nèi)積極拓展市場,提升品牌知名度和市場份額。在國內(nèi)市場,DeepSeek 可能會進一步加強與各行業(yè)企業(yè)的合作,深入挖掘行業(yè)需求,為金融、醫(yī)療、教育、制造業(yè)等領(lǐng)域提供更加定制化的人工智能解決方案。實際上,DeepSeek 已經(jīng)在多個行業(yè)展現(xiàn)出應用潛力:廣汽集團將自主研發(fā)的 ADiGO SENSE 端云一體大模型與 DeepSeek-R1 完成深度融合;重慶農(nóng)商行企業(yè)微信上線基于 DeepSeek 模型的智能助手進行風險評估和欺詐監(jiān)測;智云健康將 DeepSeek-R1 模型接入自研醫(yī)療人工智能系統(tǒng) " 智云大腦 ";網(wǎng)易有道借助 DeepSeek-R1 優(yōu)化個性化答疑功能;中控技術(shù)實現(xiàn)了工業(yè) APP 的智能構(gòu)建。
在國際市場,DeepSeek 可能會借鑒國際科技巨頭的市場拓展經(jīng)驗,采取本地化策略,根據(jù)不同國家和地區(qū)的市場特點和用戶需求,推出針對性的產(chǎn)品和服務。當然,這個過程中還需要面對地緣政治的考驗。
此外,融資后,公司將有更多資源用于探索多元化的商業(yè)變現(xiàn)模式,實現(xiàn)技術(shù)價值的最大化。除了現(xiàn)有的 API 調(diào)用收費、私有化部署等商業(yè)模式外,DeepSeek 可能會加強技術(shù)授權(quán)業(yè)務,將其先進的人工智能技術(shù)授權(quán)給其他企業(yè)使用。
然而,商業(yè)化轉(zhuǎn)型并非易事。梁文鋒曾明確表示擔憂外部干預可能讓 DeepSeek 變成 " 另一個商業(yè)機器 ",而非技術(shù)革新的先鋒。高估值融資后,投資人可能要求快速增長或上市,迫使 DeepSeek 犧牲開源模式或長期研發(fā)計劃。如何在保持技術(shù)理想與滿足商業(yè)回報之間找到平衡,將是 DeepSeek 管理層需要解決的核心矛盾。
DeepSeek 的轉(zhuǎn)折,從來不是梁文鋒一個人的 " 理想妥協(xié) ",而是整個國產(chǎn) AI 行業(yè)的縮影。在 AI 這場殘酷的長期競賽中,技術(shù)理想主義需要商業(yè)現(xiàn)實的支撐,獨立自主需要開放合作的補充,前沿探索需要生態(tài)建設的協(xié)同。DeepSeek 的融資之路,正是這種復雜平衡的開始。
(文|Leo 張 ToB 雜談,作者|張申宇,編輯丨蓋虹達)