电竞比分网-中国电竞赛事及体育赛事平台

關于ZAKER 合作
36氪 45分鐘前

“華為天才少年”創(chuàng)業(yè)連融超 4 億元,做新一代推理芯片重構顯存成本

作者 | 喬鈺杰

編輯 | 袁斯來

硬氪獲悉,國內全自研 GPGPU 創(chuàng)新企業(yè)「北京行云集成電路有限公司」(以下簡稱 " 行云 ")宣布連續(xù)完成 Pre-A 及 Pre-A+ 多輪融資,融資金額超 4 億元人民幣。五源資本、賽富投資基金、春華資本聯合領投,以及北京、江蘇等地方國資、佰維存儲(688525)、金沙江聯合帶動知名 GPU 企業(yè)創(chuàng)始人家辦、創(chuàng)維資本等產業(yè)資本跟投。云岫資本連續(xù)多輪服務并擔任下一輪獨家融資財務顧問。

北京行云集成電路有限公司成立于 2023 年 8 月,專注針對大模型的新一代推理芯片,致力于使用非 3D DRAM 架構打造超大顯存規(guī)格、CUDA 兼容的全自研 GPGPU 產品,推動 AI 大模型推理的普惠化。

行云創(chuàng)始人季宇博士,清華大學計算機系博士," 華為天才少年 " 計劃的一員,曾在華為海思深度參與昇騰 AI 芯片的編譯器與架構研發(fā)。CTO 余洪敏博士,中科院半導體所博士,曾主導百度昆侖芯、海思昇騰等多款芯片的研發(fā)與量產,擁有十余款芯片成功流片經驗。

當前,在大模型架構持續(xù)演進的背景下,算力系統(tǒng)的瓶頸正在發(fā)生結構性變化。

季宇在接受硬氪采訪時表示,當前算法側的演進正在重塑硬件設計邏輯。以 MoE(Mixture of Experts)為代表的稀疏模型,在計算效率上更具優(yōu)勢,但需要預先加載更多專家參數,使得整體對內存容量的需求顯著高于傳統(tǒng) Transformer 稠密模型。

大模型(千億 / 萬億參數)的顯存需求已從 GB 級躍升至 TB 級,這一過程中,系統(tǒng)成本結構也隨之重構——按 GB 計價的顯存成本,正逐步超過算力芯片本身,成為主導項。因此," 降本的關鍵已經不在算力,而在顯存 " 季宇稱。

基于這一判斷,行云選擇了一條與主流路徑不同的技術路線:放棄成本高昂的 HBM(高帶寬內存),轉而采用 LPDDR 乃至 NAND(SSD 顆粒)等更低成本的存儲介質作為顯存介質。通過介質替換,使顯存成本降低 1 到 2 個數量級。

但低成本介質也意味著單顆粒帶寬較低。為彌補這一短板,行云在架構上采用多顆粒、多通道并行的設計,通過規(guī)模化堆疊將整體帶寬提升至 TB 級別,以滿足大模型推理對數據吞吐的需求。

季宇表示,隨著稀疏化和 MoE 架構的發(fā)展,模型對帶寬的絕對需求正在下降,系統(tǒng)設計不再需要一味追求極致帶寬,而是可以通過軟硬件協(xié)同,實現成本與效率之間的平衡。

這種思路也體現在行云的整體技術策略中。季宇強調,公司真正的稀缺性并不在單一芯片指標,而在于系統(tǒng)級的設計能力。通過諸如 Prefill/Decode 分離(PD 分離)、KV Cache 稀疏化等工程手段,行云能夠更靈活地適配 AI 應用形態(tài)的快速變化,從早期的 Chatbot 到當前逐步興起的 Agent 場景,降低因芯片研發(fā)周期較長所帶來的技術滯后風險。

產品驗證層面,行云此前推出的 " 褐蟻一體機 ",已嘗試用 CPU 與通用內存構建低成本推理方案,驗證稀疏模型在非高端硬件上的可行性。目前,該方案已在 DeepSeek 的本地化部署場景中落地。

(圖源 / 企業(yè))

接下來,公司將把重心轉向自研芯片的推進。季宇表示,公司今年的核心目標是完成芯片流片,并盡快推向市場,以芯片產品作為商業(yè)化的主要抓手。

當下,Open Claw 的現象級傳播也揭示了市場對消費級硬件承載高質量 AI 的巨大需求。季宇表示,行云希望通過其芯片產品,將低成本、高質量的萬億級模型算力真正落地到如龍蝦機等端側設備,突破當前端側僅能運行 100B 小模型的局限,為消費電子市場打開新的想象空間。

CTO 余洪敏表示,行云的設計優(yōu)先級已從追求單芯片極致性能,轉變?yōu)閺陌寮壪到y(tǒng)角度追求可擴展性與供應鏈穩(wěn)定性。通過分布式設計和采用成熟工藝與低成本存儲,在系統(tǒng)層面實現成本最優(yōu)與性能體驗一致,這是公司實現算力普惠的重要基礎。

投資方觀點

峰瑞資本副總裁李罡表示:作為天使輪投資人,行云團隊從 23 年創(chuàng)業(yè)開始,對 AI 芯片(特別是大模型環(huán)境下的 AI 芯片)有著極為前瞻的視角和思路。在近三年的模型和應用的快速變化中,我們看到行云針對下一代通用大模型的芯片方案和前瞻的設計思想,不斷得到驗證,始終領先時代半步。

五源資本表示:行云是 AI 芯片領域少有的‘第一性原理’思考者,季宇博士 24 年就前瞻性地洞察到 MoE 稀疏架構下硬件瓶頸從算力向顯存遷移的結構性轉變——放棄 HBM、以 LPDDR 乃至 NAND 重構顯存成本,不是漸進優(yōu)化,而是通過系統(tǒng)級的軟硬件協(xié)同設計能力推動行業(yè)范式創(chuàng)新。2026 年以來隨著 AI 模型 coding 和 agent 能力持續(xù)增強,AI 推理需求爆發(fā),OpenClaw 等 Agent 的現象級破圈,正在將推理算力需求從云端拉向多端,從程序員推向大眾,高效低成本的推理能力成為行業(yè)剛需。伴隨未來推理需求的指數級增長,行云的技術路徑將成為推動算力普惠的重要基礎設施。

賽富投資基金負責科技賽道的管理合伙人蔣馳華表示:在 AI 大模型向萬億參數演進的過程中,降本的關鍵已經不在算力,而在顯存和系統(tǒng)的架構,特別是在國產算力受限的前提下。季宇和行云團隊展現出了罕見的系統(tǒng)級工程視野,他們跳出了盲目堆砌 HBM 的行業(yè)定式,通過 LPDDR/NAND 等介質替換與并行架構設計,將顯存和系統(tǒng)成本打下來一到兩個數量級,進而實現單 Token 成本極值,符合行業(yè)演進的方向。我們始終聚焦 AI 與具身智能領域的底層顛覆者。行云兼具前瞻的架構創(chuàng)新與扎實的落地能力,賽富很榮幸能在這一輪重倉支持。我們期待行云的新一代推理芯片徹底重構算力成本模型,真正實現大模型推理在云端與端側的全面普惠。

春華資本表示:在國產算力生態(tài)加速構建的大背景下。行云敏銳地將設計重心錨定在顯存成本重構上,以 LPDDR 與 NAND 替代 HBM、通過多通道并行架構彌補單顆粒帶寬不足,本質上是在重新定義推理芯片的成本架構。季宇博士對 AI 芯片架構的演進方向有著超越行業(yè)慣性的深度思考,他對‘降本關鍵在顯存而非算力’的判斷,始終領先行業(yè)共識半步,且每一步都在被市場持續(xù)驗證;余洪敏博士作為從海思昇騰到百度昆侖芯一路走來的芯片老兵,對芯片從設計到量產的每一個環(huán)節(jié)都有實戰(zhàn)積累。這種‘敢想’與‘能做’的結合,讓行云具備了從架構創(chuàng)新到產品交付的完整閉環(huán)能力。我們期待行云的首顆自研芯片順利流片,開啟 AI 推理算力的新一輪成本革命。

佰維存儲科技股份有限公司副總經理王燦:在大模型從通用 AI 向 Agent 形態(tài)演進的發(fā)展階段,季宇博士展現了極具前瞻性的系統(tǒng)級洞察。他精準地識別出:大模型推理的結構性瓶頸已不再僅僅是算力本身,而是制約規(guī)模化落地的更低成本的存儲。行云的核心邏輯非常清晰——通過介質替換與架構創(chuàng)新,以低成本的 LPDDR 乃至 NAND 介質挑戰(zhàn)昂貴的 HBM 霸權,這不僅是物理介質的更迭,更是對大模型推理成本結構的底層重構。圍繞這一核心路徑,行云構建了極致的軟硬件協(xié)同設計,通過 PD 分離、分布式擴展等手段,在系統(tǒng)層面實現了性能與成本的平衡。芯片行業(yè),工程經驗決定了從‘實驗室架構’到‘商業(yè)化量產’的跨度。行云團隊在昇騰、昆侖芯等頂尖項目上積淀的深厚流片與量產經驗,是其確定性的來源。在 AI Agent 爆發(fā)的當下,我堅信行云能夠真正擊穿算力成本,讓高質量的萬億級模型實現真正的算力普惠。

相關標簽
36氪

36氪

讓創(chuàng)業(yè)更簡單

訂閱

覺得文章不錯,微信掃描分享好友

掃碼分享

熱門推薦

查看更多內容

企業(yè)資訊

查看更多內容