电竞比分网-中国电竞赛事及体育赛事平台

關(guān)于ZAKER 合作
粵語(yǔ)音樂(lè)噴泉 5小時(shí)前

中科曙光李斌“芯片 + 系統(tǒng)優(yōu)化”正重新定義國(guó)產(chǎn)算力突圍底層邏輯

" 可以通過(guò)芯片一定的專用化和系統(tǒng)端的優(yōu)化,來(lái)彌補(bǔ)與國(guó)外的差距。"4 月 14 日,在中科曙光發(fā)布中國(guó)最大 6 萬(wàn)卡 AI4S 計(jì)算集群之際,公司高級(jí)副總裁李斌面對(duì)媒體的這句表態(tài),若孤立來(lái)看,不過(guò)是國(guó)產(chǎn)算力企業(yè)對(duì) " 如何追趕 " 的又一次技術(shù)性回應(yīng)。

但如果將其嵌入中科曙光的戰(zhàn)略布局——全球首個(gè)單機(jī)柜級(jí) 640 卡超節(jié)點(diǎn)、全棧自研 400G 無(wú)損高速網(wǎng)絡(luò) scaleFabric、浸沒(méi)相變液冷技術(shù)將 PUE 壓至 1.04、scaleX 萬(wàn)卡超集群部分技術(shù)指標(biāo)超越海外同類產(chǎn)品 2027 年路線圖節(jié)點(diǎn)——就會(huì)發(fā)現(xiàn),這句話里藏著國(guó)產(chǎn)算力產(chǎn)業(yè)最深刻的一次路徑范式轉(zhuǎn)移。

李斌所言的 " 芯片專用化 + 系統(tǒng)端優(yōu)化 ",不是對(duì)國(guó)產(chǎn)芯片單卡性能差距的被動(dòng)妥協(xié),而是一場(chǎng)從 " 暴力計(jì)算 " 到 " 系統(tǒng)工程 " 的主動(dòng)范式切換——當(dāng)海外巨頭還在用更先進(jìn)制程的通用 GPU 堆算力時(shí),中科曙光選擇了一條更務(wù)實(shí)的路徑:用專用芯片匹配特定場(chǎng)景,用系統(tǒng)級(jí)協(xié)同把每一張國(guó)產(chǎn)加速卡的利用率榨干到極致。

要理解這場(chǎng)范式轉(zhuǎn)移的分量,需要先看清算力競(jìng)爭(zhēng)的核心矛盾已發(fā)生質(zhì)變。過(guò)去,算力的提升主要依賴于 GPU 等單一處理器性能的迭代。但當(dāng)大模型參數(shù)向萬(wàn)億級(jí)甚至十萬(wàn)億級(jí)跨越時(shí)," 暴力計(jì)算 " 模式正在觸碰物理與效率的極限。傳統(tǒng)集群在規(guī)模擴(kuò)大后,通信開銷往往占用 30%-50% 的資源,芯片算得再快,數(shù)據(jù)傳不動(dòng)、存不下、散熱跟不上,整體效率依然被迅速稀釋。

這正是李斌 " 芯片專用化 " 邏輯的第一層精妙之處——不是做一顆 " 什么都行 " 的通用芯片,而是面向大模型訓(xùn)練、科學(xué)計(jì)算等特定場(chǎng)景做架構(gòu)級(jí)定制,把有限的晶體管預(yù)算用在最需要的計(jì)算模式上。而 " 系統(tǒng)端優(yōu)化 " 則是第二層更具戰(zhàn)略縱深的布局:中科曙光的 scaleFabric 網(wǎng)絡(luò)端到端時(shí)延低至 0.9 微秒,鏈路故障恢復(fù)小于 1 毫秒,單子網(wǎng)互連規(guī)模達(dá)傳統(tǒng) InfiniBand 的 2.33 倍,理論可支持最大 11.4 萬(wàn)卡集群部署。通過(guò) " 超級(jí)隧道 " 技術(shù)實(shí)現(xiàn)芯片級(jí)、系統(tǒng)級(jí)到應(yīng)用級(jí)的三級(jí)數(shù)據(jù)傳輸協(xié)同優(yōu)化,AI 加速卡資源利用率可提高 55%。

從單卡算力焦慮,到系統(tǒng)效率為王,國(guó)產(chǎn)算力的競(jìng)爭(zhēng)邏輯正在被李斌和他的團(tuán)隊(duì)一毫米一毫米地重塑。當(dāng)英偉達(dá)的封閉生態(tài)仍在用更先進(jìn)制程的通用 GPU 定義行業(yè)標(biāo)準(zhǔn)時(shí),中科曙光選擇了一條更開放、更務(wù)實(shí)的路徑:用 AI 計(jì)算開放架構(gòu)協(xié)同 20 多家產(chǎn)業(yè)鏈企業(yè),從技術(shù) " 單點(diǎn)突圍 " 走向產(chǎn)業(yè) " 生態(tài)共進(jìn) "。

算力競(jìng)賽從來(lái)不是一場(chǎng)百米沖刺,而是一場(chǎng)接力馬拉松。那些不再糾結(jié)于 " 單卡參數(shù)比英偉達(dá)差多少 " 的人,才能在 " 萬(wàn)卡集群能不能穩(wěn)定跑起來(lái) " 這道真正的產(chǎn)業(yè)命題上,交出屬于自己的答案——因?yàn)闆Q定 AI 能走多遠(yuǎn)的,從來(lái)不是某一塊芯片的峰值算力,而是整個(gè)系統(tǒng)日復(fù)一日、夜復(fù)一夜的穩(wěn)定協(xié)同。

覺(jué)得文章不錯(cuò),微信掃描分享好友

掃碼分享

熱門推薦

查看更多內(nèi)容

企業(yè)資訊

查看更多內(nèi)容