电竞比分网-中国电竞赛事及体育赛事平台

關(guān)于ZAKER Skills 合作
雷鋒網(wǎng) 23小時(shí)前

DeepSeek V4 首發(fā)適配背后:昇騰為什么堅(jiān)持不做 CUDA 兼容層?

AI 行業(yè)的節(jié)奏正在變得越來越快。

從去年的大模型,到今年 Agent 的集中爆發(fā),技術(shù)熱點(diǎn)在持續(xù)切換。但在表層變化之下,有一個(gè)趨勢(shì)幾乎沒有發(fā)生改變:模型規(guī)模與使用強(qiáng)度的提升,正在持續(xù)推高對(duì)算力的需求。

當(dāng)模型規(guī)模、調(diào)用頻率與應(yīng)用復(fù)雜度同時(shí)增長(zhǎng),單純依賴算力堆疊已經(jīng)難以為繼。

在這種局面下,開發(fā)者天然希望找到一套已經(jīng)經(jīng)過驗(yàn)證、能覆蓋全鏈路的成熟體系。這正是 CUDA 生態(tài)在過去十幾年建立起來的護(hù)城河:它不僅提供了算力,更定義了從編程到部署的一整套標(biāo)準(zhǔn)。

也正是在這樣的背景下,一個(gè)更現(xiàn)實(shí)的問題開始浮出水面:當(dāng) CUDA 生態(tài)已經(jīng)形成穩(wěn)定閉環(huán),后來者的路徑到底是什么?是盡可能兼容,以降低遷移成本;還是從底層出發(fā),建立一套不依附既有體系的新結(jié)構(gòu)?

華為張良給出了他的答案,他在分享會(huì)上反復(fù)強(qiáng)調(diào):如果底層結(jié)構(gòu)不改變,上層生態(tài)就很難真正建立。

這意味著,當(dāng)前這場(chǎng)競(jìng)爭(zhēng),已經(jīng)不只是算力性能的比較,而是一次圍繞 " 體系 " 的重構(gòu)。

為什么 " 繼續(xù)優(yōu)化 " 已經(jīng)不夠了?

在 AI 基礎(chǔ)設(shè)施發(fā)展的早期階段," 能不能跑起來 " 曾經(jīng)是最核心的判斷標(biāo)準(zhǔn)。

但隨著大模型進(jìn)入工程化與規(guī)?;A段,這一標(biāo)準(zhǔn)迅速變得不再充分。系統(tǒng)的瓶頸,開始從 " 單點(diǎn)能力不足 ",轉(zhuǎn)向 " 整體鏈路是否匹配真實(shí)負(fù)載 "。

張良在回顧昇騰早期發(fā)展時(shí),并沒有回避這一點(diǎn)。他提到,"2018 年 CANN 剛發(fā)布時(shí),我們知道 CANN 和硬件都是不完美的 "。

那一階段屬于典型的 " 可運(yùn)行但未成熟 " 狀態(tài),行業(yè)的關(guān)注點(diǎn)更多集中在框架對(duì)比、性能指標(biāo)等表層問題,而真正決定長(zhǎng)期能力的底層結(jié)構(gòu),并沒有被充分展開。

面對(duì)大模型時(shí)代的新負(fù)載——長(zhǎng)序列帶來的訪存壓力、低精度訓(xùn)練成為主流,以及 MoE 等復(fù)雜模型架構(gòu)的涌現(xiàn),昇騰急需解決編程模型不夠靈活、訪存粒度無法適配、低精度支持缺失等問題。

這些問題無法通過軟件優(yōu)化或算子補(bǔ)丁徹底解決,只能在芯片和系統(tǒng)底層重新設(shè)計(jì)。

轉(zhuǎn)折發(fā)生在近兩年。

按照張良的說法,從 2025 年開始,昇騰團(tuán)隊(duì) " 痛下決心 ",不再圍繞局部問題進(jìn)行修補(bǔ),而是回到一個(gè)更根本的判斷:如果底層結(jié)構(gòu)不改變,上層生態(tài)就不可能真正建立。

在最新一代昇騰 950 芯片中,這種調(diào)整體現(xiàn)在多個(gè)方面:編程模型更接近主流并行計(jì)算范式,降低開發(fā)遷移成本;數(shù)據(jù)訪問引入更細(xì)粒度訪存機(jī)制,以減少大模型場(chǎng)景下的無效帶寬消耗;同時(shí)提前支持 FP8 等低精度計(jì)算,以提升吞吐并支撐更大模型規(guī)模。

張良提到:" 有客戶在測(cè)試不到一周后,就直接做出了下單決策。"

與此同時(shí),昇騰在架構(gòu)路徑上也做出了一個(gè)關(guān)鍵選擇。在專用加速芯片逐漸興起的背景下,針對(duì)特定場(chǎng)景進(jìn)行深度優(yōu)化,往往可以獲得更高的短期效率。

但張良明確表示,團(tuán)隊(duì)并沒有沿著這一路徑繼續(xù)推進(jìn),而是堅(jiān)持通用架構(gòu)方向。原因在于,如果系統(tǒng)能力被限定在特定場(chǎng)景中,就很難形成外溢,也無法支撐多樣化應(yīng)用的持續(xù)增長(zhǎng)。

這一選擇意味著,昇騰并不只是試圖把模型 " 跑得更快 ",而是在解決一個(gè)更長(zhǎng)期的問題:當(dāng)模型不斷變化、負(fù)載持續(xù)增長(zhǎng)、開發(fā)范式不斷演進(jìn)時(shí),這套系統(tǒng)是否仍然能夠承載這些變化。

為什么不能 " 做一個(gè) CUDA 兼容層 "?

如果說底層結(jié)構(gòu)決定了一套系統(tǒng) " 能做到什么 ",那么生態(tài)則決定了 " 有沒有人愿意在上面繼續(xù)做 "。

在當(dāng)前 AI 基礎(chǔ)設(shè)施格局中,CUDA 已經(jīng)不僅是一套技術(shù)方案,而是一整套高度穩(wěn)定的開發(fā)體系。從編程模型、工具鏈到社區(qū)與人才結(jié)構(gòu),它所形成的,不只是功能層面的能力,更是一種 " 默認(rèn)可用 " 的環(huán)境。

對(duì)于后來者而言,最直接的路徑,是盡可能向這一體系靠攏——通過接口兼容與生態(tài)復(fù)用,降低開發(fā)者的遷移門檻。

這是一條現(xiàn)實(shí)且常見的路徑,但昇騰并沒有選擇沿著它走下去。

張良給出的判斷非常直接:" 如果基于 CUDA 來做,那我們做的一切生態(tài)發(fā)展,都無法徹底自主。"

這句話所指向的,并不只是技術(shù)路線之爭(zhēng),而是一個(gè)更底層的問題:如果核心體系建立在他人的標(biāo)準(zhǔn)之上,那么無論投入多少工程資源,最終強(qiáng)化的仍然是原有系統(tǒng),而不是自身能力。

進(jìn)一步看,這種依附關(guān)系還意味著技術(shù)演進(jìn)主動(dòng)權(quán)的缺失。張良提到," 一旦出現(xiàn)危機(jī)的時(shí)刻,這一套體系做不到,你的特性在里面就沒了。"

這里的 " 特性 ",不僅是具體功能,也包括體系能夠持續(xù)演進(jìn)的空間。如果關(guān)鍵能力受限于既有框架,那么新的特性就很難真正落地,更難形成長(zhǎng)期積累。

在這一判斷之下,昇騰選擇了一條更復(fù)雜但更具獨(dú)立性的路徑:在底層體系上堅(jiān)持自研,在上層生態(tài)上盡可能對(duì)齊主流。

這意味著,在虛擬指令集、編譯器以及運(yùn)行時(shí)等關(guān)鍵環(huán)節(jié),昇騰不依賴既有標(biāo)準(zhǔn),而是構(gòu)建自己的實(shí)現(xiàn);而在開發(fā)接口與使用方式上,則主動(dòng)適配主流框架,使開發(fā)者可以在熟悉的環(huán)境中使用這套系統(tǒng)。

這種 " 分層處理 " 的方式,本質(zhì)上是在控制權(quán)與使用門檻之間尋找平衡:既不完全依附,也不讓開發(fā)者從零開始。

但這條路徑的難度,很快體現(xiàn)在實(shí)際推進(jìn)過程中。

在主流開源框架中,新硬件往往只能以插件形式接入,難以進(jìn)入主干體系。

張良提到,昇騰最初面對(duì)的正是這樣的情況——對(duì)方并不直接接納,而是建議 " 你們可以自己做插件 "。這意味著,生態(tài)上的 " 可用 " 與 " 被認(rèn)可 " 之間,仍然存在明顯距離。

昇騰的做法,是持續(xù)參與開源社區(qū):提交代碼、對(duì)齊規(guī)范,并通過工程實(shí)踐驗(yàn)證自身實(shí)現(xiàn)的穩(wěn)定性。在這個(gè)過程中,關(guān)系逐漸發(fā)生變化,從最初的外部適配,轉(zhuǎn)向更深層的協(xié)同。

例如在 Triton 中實(shí)現(xiàn)后端支持,在 PyTorch Foundation 體系中建立起持續(xù)集成流程,使平臺(tái)能夠跟隨主版本演進(jìn)保持同步。這些變化的意義,在于昇騰不再只是 " 接入生態(tài) ",而是開始參與生態(tài)本身的構(gòu)建。

與此同時(shí),生態(tài)建設(shè)也被進(jìn)一步轉(zhuǎn)化為可量化的工程問題。

張良提到,昇騰對(duì)開源軟件的支持能力、以及開源軟件對(duì)昇騰特性的支持程度,被細(xì)化為特性支持率、模型適配率、CI 覆蓋率等一系列指標(biāo)," 要求必須維持在 95% 以上 "。

在模型側(cè),昇騰也在推進(jìn)類似的覆蓋能力。

昇騰已在 DeepSeek V4 發(fā)布當(dāng)天實(shí)現(xiàn)全系列適配,950 超節(jié)點(diǎn)推理時(shí)延低至 10~20ms,并通過 PyPTO 編程范式將算子開發(fā)周期縮短至天級(jí)。

不過,這一路徑并非沒有不確定性。

在一個(gè)已經(jīng)高度收斂的生態(tài)體系中,新的平臺(tái)不僅要補(bǔ)齊能力,還需要在時(shí)間上追趕。這不僅是技術(shù)問題,更是節(jié)奏問題:當(dāng)主流框架持續(xù)快速迭代時(shí),新體系是否能夠長(zhǎng)期保持同步,并逐步建立自身影響力,仍然取決于持續(xù)的工程投入與社區(qū)協(xié)同。

也正是在這一意義上," 做一個(gè) CUDA 兼容層 " 之所以沒有被選擇,是因?yàn)樗鼰o法回答一個(gè)更關(guān)鍵的問題——當(dāng)生態(tài)演進(jìn)發(fā)生變化時(shí),這套體系是否仍然擁有自己的位置與空間。

Agent 是新范式,還是 " 生態(tài)未成熟的補(bǔ)丁 "?

在傳統(tǒng) AI 工程體系中,開發(fā)過程高度依賴人工經(jīng)驗(yàn)。

從算子實(shí)現(xiàn)到性能調(diào)優(yōu),每個(gè)環(huán)節(jié)都需要工程師深入理解硬件、反復(fù)調(diào)試。這種模式在早期復(fù)雜度較低時(shí)尚可應(yīng)對(duì),但隨著模型規(guī)模擴(kuò)大、系統(tǒng)鏈路拉長(zhǎng),人的處理能力開始成為效率瓶頸。

昇騰的應(yīng)對(duì)方式,不是繼續(xù)在工具層面做優(yōu)化,而是引入新的執(zhí)行主體—— Agent。

最直接的變化出現(xiàn)在算子開發(fā)環(huán)節(jié):過去手寫算子需要深入硬件、反復(fù)調(diào)試,現(xiàn)在開發(fā)者只需描述設(shè)計(jì)意圖,Agent 就可以自動(dòng)完成環(huán)境配置并生成代碼。開發(fā)起點(diǎn)從 " 如何實(shí)現(xiàn) " 轉(zhuǎn)向 " 要實(shí)現(xiàn)什么 "。

圍繞這一思路,昇騰將 Agent 擴(kuò)展到更完整的流程——從模型檢索、適配、量化,到遷移、優(yōu)化與部署,原本分散的步驟被整合為一條連續(xù)路徑。

張良給出的目標(biāo)是:" 一分鐘找到模型,一小時(shí)驗(yàn)證,一天完成部署。" 壓縮的不只是時(shí)間,更是試錯(cuò)成本與迭代周期。

支撐這一體系的,是 "Skill" ——一種標(biāo)準(zhǔn)化的能力單元,它將專家經(jīng)驗(yàn)、調(diào)優(yōu)方法以及工程流程以模塊化方式沉淀下來,供 Agent 直接調(diào)用組合。

這意味著,原本依附于個(gè)體經(jīng)驗(yàn)的能力,開始被轉(zhuǎn)化為系統(tǒng)的一部分。開發(fā)者不再需要從零構(gòu)建流程,而是通過定義目標(biāo)與約束,讓系統(tǒng)完成大部分執(zhí)行工作。

在標(biāo)準(zhǔn)化程度較高、路徑清晰的任務(wù)中,Agent 可以顯著提升效率。但張良坦言,在 " 最深層次的復(fù)雜問題 " 上,當(dāng)前 Agent 的能力 " 還不是那么強(qiáng) ",仍然離不開工程師的深度參與。

這使得 Agent 呈現(xiàn)出一種過渡性特征:一方面,它確實(shí)在改變開發(fā)節(jié)奏,使原本以天甚至周為單位的流程被壓縮到小時(shí)級(jí);另一方面,它也在承擔(dān)一層 " 緩沖 " 的角色——在生態(tài)尚未完全成熟、底層差異仍然存在的情況下,通過自動(dòng)化能力降低使用門檻。

這也引出一個(gè)更深遠(yuǎn)的問題:Agent 所帶來的,是一種長(zhǎng)期穩(wěn)定的新范式,還是在體系尚未完善時(shí)的過渡機(jī)制?答案或許取決于 Skill 的沉淀速度和底層差異的收斂程度。但無論如何,它在當(dāng)下已經(jīng)實(shí)實(shí)在在地改變了開發(fā)節(jié)奏。

回到最初的問題:當(dāng) CUDA 已經(jīng)成為事實(shí)標(biāo)準(zhǔn),后來者是否還有空間?

從昇騰這一路徑來看,它給出的答案,并不是正面替代,也不是簡(jiǎn)單兼容,而是試圖在既有體系之外,構(gòu)建一套可以獨(dú)立運(yùn)轉(zhuǎn)的結(jié)構(gòu),讓這套系統(tǒng)在不依賴既有生態(tài)的情況下,仍然具備自洽能力。

當(dāng)然,這一選擇仍然處在進(jìn)行時(shí)之中。生態(tài)能否持續(xù)積累、與主流框架的協(xié)同能否長(zhǎng)期穩(wěn)定、開發(fā)方式的變化能否真正沉淀為工程能力,這些都需要時(shí)間來驗(yàn)證。

雷峰網(wǎng)雷峰網(wǎng) ( 公眾號(hào):雷峰網(wǎng) )

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

相關(guān)標(biāo)簽
ai

相關(guān)閱讀

最新評(píng)論

沒有更多評(píng)論了

覺得文章不錯(cuò),微信掃描分享好友

掃碼分享

熱門推薦

查看更多內(nèi)容

企業(yè)資訊

查看更多內(nèi)容