电竞比分网-中国电竞赛事及体育赛事平台

關(guān)于ZAKER Skills 合作
鈦媒體 14小時(shí)前

大模型的“保質(zhì)期”比牛奶還短

文 | 影子備忘錄

2026 年,大模型行業(yè)正經(jīng)歷一場(chǎng)前所未有的 " 寒武紀(jì) " 式的資本糾葛。當(dāng)眾人以為大模型的終點(diǎn)是 " 免費(fèi) " 時(shí),行情卻拐入了 " 付費(fèi)升級(jí)車道 "。從 " 倒貼白送 " 到 " 逐步漲價(jià) ",再到價(jià)格戰(zhàn)的突然重啟,大模型的 " 定價(jià)系統(tǒng) " 正在以前所未有的速度反復(fù)橫跳。

與此同時(shí),模型本身的生命周期也在急劇縮短。2024 年,一個(gè)大模型的版本迭代周期平均約需 132 天;而到了 2026 年,這個(gè)數(shù)字已經(jīng)減半,甚至在某些場(chǎng)景下縮為按天計(jì)算。行業(yè)正用一種前所未有的時(shí)間刻度,丈量著 AI 技術(shù)演進(jìn)的速度。

但在進(jìn)入這場(chǎng)令人眩暈的漲跌迷霧之前,先給看到這篇文章的朋友們簡(jiǎn)單普及一下整個(gè) AI 大模型的鏈條:

基建層(GPU/AI 芯片):AI 世界的基礎(chǔ)物理層,相當(dāng)于蓋房子的磚瓦。

模型層(MaaS/ 大模型 API):基于 AI 芯片預(yù)訓(xùn)練出來的通用大模型,以 " 模型即服務(wù) " 模式進(jìn)行市售調(diào)用。

應(yīng)用層(Agent 應(yīng)用 / 聊天軟件):基于基座大模型構(gòu)建的 AI Agent 和各類應(yīng)用項(xiàng)目。

來源:九派財(cái)經(jīng)

貶值后翻倍:大模型定價(jià)的 " 過山車 "

先看幾組數(shù)據(jù),感受一下這過山車式的陡峭幅度。

暴跌的背后。2025 年的 " 價(jià)格戰(zhàn) " 幾乎將 AI 的服務(wù)價(jià)值近乎歸零。研究者統(tǒng)計(jì),2024 年底至 2025 年中,AI 開發(fā)領(lǐng)域經(jīng)歷了劇烈震蕩:某頭部平臺(tái)率先將百萬 Token 價(jià)格從行業(yè)均價(jià) 50 元壓降至 0.3 元,全行業(yè)價(jià)格平均下降了約 87%,部分基礎(chǔ)套餐甚至出現(xiàn)了 " 買一送十 " 的極端促銷。

字節(jié)豆包視覺理解模型的價(jià)格一度低至 0.003 元 / 千 Tokens;而市場(chǎng)調(diào)研報(bào)告顯示,最低端模型與最高端旗艦之間的單價(jià)差距已經(jīng)擴(kuò)大到了驚人的 33 倍。彼時(shí),AI 界瘋狂涌入的資本讓大模型陷入了算力的 " 造富神話 ",但也導(dǎo)致行業(yè)出現(xiàn)嚴(yán)重的傾銷與惡性循環(huán)。

再升值。然而僅僅過了一個(gè)年關(guān),2026 年初,在瘋狂的 " 價(jià)格傾銷戰(zhàn) " 之后,因?yàn)樗懔Y本投入殆盡,大模型廠商迎來了 " 絕地反攻 "。2026 年 3 月,從國外巨頭到國內(nèi)廠商,包括谷歌云、亞馬遜云、騰訊云、阿里云在內(nèi),在 10 天內(nèi)相繼發(fā)布調(diào)價(jià)公告,核心 AI 算力與存儲(chǔ)服務(wù)價(jià)格普遍上調(diào)約 30% 至 50%。

進(jìn)入到 2026 年 4 月,大模型圈更是漲聲一片:騰訊云 API 輸入價(jià)格最高暴漲 463%,智譜 AI 在短短幾個(gè)月內(nèi)連續(xù)三次提價(jià),阿里云更是直接停售了最低版套餐服務(wù)。

更可怕的是,變相漲價(jià)也在悄然蔓延。2026 年 4 月,Anthropic 發(fā)布 Claude Opus 4.7 時(shí),采用了全新的分詞器,其官方稱相同文本最多消耗多了 35% 的 Token,在真實(shí)的代碼場(chǎng)景下實(shí)際消耗甚至可能是上一代的 1.32 倍至 1.47 倍。這意味著,即使價(jià)格不變,重度用戶的單位成本也在自動(dòng)膨脹。

AI 開始從 " 平價(jià)礦燈 " 轉(zhuǎn)向 " 按米計(jì)價(jià)的奢侈品 "。一個(gè)世紀(jì)難題出現(xiàn)在了各個(gè)企業(yè)的賬面中:AI 到底該按照什么價(jià)格收費(fèi)?

Token 從賣權(quán)到商品,App Store 化加速

為何大模型市場(chǎng)會(huì)陷入如此劇烈的 " 價(jià)值震蕩 "?其根源在于 AI 正在從 " 技術(shù)創(chuàng)新品 " 轉(zhuǎn)變成 " 數(shù)字定制消費(fèi)品 ",市場(chǎng)已經(jīng)跳出了科技的范疇,落入經(jīng)濟(jì)學(xué)推演的基礎(chǔ)邏輯。

其最主要的趨勢(shì),就是大模型的 "App Store 化 " ——一個(gè)不再追求開源開放,而是模仿移動(dòng)應(yīng)用商店的封閉化生態(tài)。

正如當(dāng)年的智能手機(jī)操作系統(tǒng)(iOS/Android)把應(yīng)用程序變成了 " 獨(dú)立電商 ",大模型的商業(yè)賽馬也從 " 傾銷獲客 " 邁進(jìn)到了 " 訂閱收金 " 的深度運(yùn)營。

2024 至 2025 年的免費(fèi) / 低價(jià)策略只是為了搶奪傳統(tǒng)互聯(lián)網(wǎng)企業(yè)的 " 數(shù)字化心智 "。短短一年多,當(dāng) AI 成為了真正的核心技術(shù)窗口,一場(chǎng)對(duì)產(chǎn)品和用戶的分級(jí)鎖客運(yùn)動(dòng)已經(jīng)全面展開。

第一步,精細(xì)化收割。2026 年 3 月,谷歌對(duì) Gemini API 的計(jì)費(fèi)檔位進(jìn)行分類計(jì)費(fèi):標(biāo)準(zhǔn)(Standard)、彈性(Flex)、優(yōu)先(Priority)、批量(Batch)和緩存(Caching)等五大模式。彈性檔位利用閑置算力提供五折優(yōu)惠,但延遲時(shí)間更長;而優(yōu)先檔位的定價(jià)則比標(biāo)準(zhǔn)價(jià)格高出 75% 至 100%。

你在付費(fèi)的時(shí)候,不僅要衡量該 API 最終返回的 Token 值,甚至連這些 Token 的執(zhí)行速度、效能指標(biāo)甚至算力的 " 富貴純度 " 都被分割成了不同價(jià)位的商品。AI 大模型不再是一個(gè)簡(jiǎn)單的工具,而已然變成了像 " 水電 " 一樣的高度分層化商品。

第二步,廉價(jià)套餐 " 殺蟲 "。2026 年初,智譜正式取消了 GLM 早期版本的首次購買優(yōu)惠(不少新用戶要額外掏出 30% 左右的溢價(jià)才能享受到原本同樣的功能)。阿里百煉平臺(tái)的 Coding Plan Lite 基礎(chǔ)套餐也被悄然暫停續(xù)費(fèi)升級(jí),變相倒逼輕微用戶轉(zhuǎn)向更高成本的中產(chǎn)套餐。

第三步,跨層殺熟。當(dāng)企業(yè)用戶發(fā)現(xiàn)將基建移動(dòng)到特定廠商系統(tǒng)后,更換模型轉(zhuǎn)換成本太高,處于 " 被動(dòng)鎖定 " 狀態(tài)時(shí),模型廠商開始利用這種鎖客效應(yīng)進(jìn)行加價(jià)——這時(shí)即便漲價(jià),客戶也沒有回旋的余地。用戶購買的 AI 智商不再是通用商品,而是被困在了定制生態(tài)中的特定應(yīng)用與數(shù)據(jù)孤島里。

大模型沒有中年期,只有 " 春秋時(shí)代 "

價(jià)格是表面的現(xiàn)象,更深層的變革在于大模型自身的演進(jìn)節(jié)奏。大模型正在經(jīng)歷從 " 年邁穩(wěn)健 " 轉(zhuǎn)向 " 少年生猛 " 的極速放量周期。

從 2023 年行業(yè)處于 " 實(shí)驗(yàn)與試探期 ",到 2025 年中全球科技公司進(jìn)入 " 末日追逐賽 " ——據(jù)不完全統(tǒng)計(jì),2025 年前七個(gè)月,中美參與模型競(jìng)爭(zhēng)的 11 家科技公司發(fā)布了至少 29 版大模型,平均每 7.1 天就有一版新模型被發(fā)布。

這種更新速度是什么概念?如果一個(gè)大模型半年才有一次重大升級(jí),那么它可能已經(jīng)被七八次迭代甩在了后面。AI 行業(yè)的 " 版本保質(zhì)期 " 不再是按月計(jì)算,而可能是按周乃至按天計(jì)算。

來看一組更直觀的數(shù)據(jù):OpenAI 的 o1 到 o3 周期是 132 天;而隨著市場(chǎng)競(jìng)爭(zhēng)的加劇,DeepSeek-V3 兩個(gè)版本的更新時(shí)間直接縮短到了 87 天,谷歌 Gemini 2.5 的兩個(gè)版本更新周期僅有 42 天。到了 2025 年 7 月,阿里 Qwen 3 基礎(chǔ)模型更新距最初發(fā)布只過去了 85 天,相比其 2.5 代模型的 132 天周期大幅縮減。

更精彩的是,不僅更新周期被壓縮,模型的發(fā)布成本也在被革命性地顛覆。DeepSeek-V4 依靠全新的混合注意力架構(gòu)(壓縮稀疏注意力 + 高度壓縮注意力),將處理每百萬 Token 上下文的算力(FLOPs)和顯存(KV cache)分別降低到了上一代版本的 27% 和 10% 的量級(jí)。這種 " 效率翻倍 + 成本腰斬 " 的創(chuàng)新,直接把 GPT-5.5 的 API 定價(jià)打成了零頭。

當(dāng)模型迭代周期從百天級(jí)壓縮到周級(jí),當(dāng)天價(jià)算力成本一夜之間被算法優(yōu)化腰斬,大模型領(lǐng)域的技術(shù)紅利期正在以肉眼可見的速度縮短。行業(yè)的寡頭壁壘不再堅(jiān)固,一紙論文、一次開源發(fā)布都有可能在一夜之間改寫市場(chǎng)格局。

淘汰戰(zhàn)、雙向內(nèi)卷與消費(fèi)者被動(dòng)接盤

更加吊詭的問題是:當(dāng)一個(gè)產(chǎn)品的 " 購買成本 " 與 " 技術(shù)貶值程度 " 同步飆漲時(shí),背后到底誰在獲益?

2026 年初,國內(nèi)的 AI 資金邏輯在極短時(shí)間內(nèi)就上演了波動(dòng)的 " 囚徒困境 " ——哪怕在高價(jià)之下,企業(yè)依然陷入被動(dòng)內(nèi)卷。

對(duì)于普通消費(fèi)者而言,能直觀感受到的是免費(fèi)額度正在收緊。大模型 Chat 產(chǎn)品開始限制提問次數(shù)以及附件識(shí)別字符," 一杯奶茶錢 " 等嘗鮮式的首月優(yōu)惠套餐正在悄然下架。曾經(jīng)免費(fèi)暢飲的時(shí)代正在遠(yuǎn)去,取而代之的是一個(gè)逐步規(guī)范但門檻更高的付費(fèi)體系。

對(duì)于中小企業(yè)而言,這種沖擊尤其劇烈。還記得早期的 AI 價(jià)格戰(zhàn)嗎?2025 年的市場(chǎng)格局被劃分為 " 旗艦級(jí)深度推理 " 與 " 極速通用 " 兩個(gè)戰(zhàn)場(chǎng),最高價(jià)與最低價(jià)之間的成本差距已經(jīng)超過了 100 倍。

這就意味著,開發(fā)公司必須高度精選自己的業(yè)務(wù)模型,一旦選擇稍有偏頗,AI 項(xiàng)目的資金投入可能瞬間超出預(yù)算數(shù)倍。

與此同時(shí),行業(yè)內(nèi)部也在發(fā)生 " 雙線撕裂 " ——大模型公司把越來越多的 " 隱性掉頭 " 成本間接轉(zhuǎn)嫁給客戶。2026 年 3 月,Claude Code 的某次版本更新引發(fā) "Tokenocalypse" 事件——部分 Max 20x 重度用戶在 70 分鐘內(nèi)就消耗了整整一周的充值額度。

更有甚者,Anthropic 在幾次升級(jí)后宣布訂閱額度僅覆蓋官方產(chǎn)品,第三方框架必須單獨(dú)走 API 付費(fèi)模式,這讓部分重度開源生態(tài)的開發(fā)者用戶成本增幅最高達(dá)到 50 倍。

價(jià)格戰(zhàn)為何突然又復(fù)活了

就在市場(chǎng)已經(jīng)打定主意準(zhǔn)備 " 集體漲價(jià)過個(gè)好日子 " 的時(shí)候,一個(gè)意想不到的反轉(zhuǎn)突然上演——價(jià)格戰(zhàn)居然又復(fù)活了。

2026 年 4 月 24 日,DeepSeek-V4 預(yù)覽版正式發(fā)布并同步開源。就在兩天之內(nèi),DeepSeek 先是宣布 V4-Pro 模型 API 開啟限時(shí) 2.5 折價(jià)格優(yōu)惠,緊接著又宣布全系列 API 服務(wù)的輸入緩存命中價(jià)格降至原有價(jià)格的 1/10。

最新調(diào)價(jià)后,DeepSeek-V4-Flash 每百萬 Token 輸入緩存命中價(jià)格僅為 0.02 元人民幣。這一串連鎖降價(jià),直接把那些剛剛提價(jià)的高檔閉源模型的定價(jià)策略戳得千瘡百孔。

更深遠(yuǎn)的沖擊在于,DeepSeek 此舉不只是降價(jià),它直接打破了 " 開源模型永遠(yuǎn)落后閉源頂流 " 的魔咒。以往閉源廠商可以靠 " 性能壁壘 " 維持天價(jià)收費(fèi),但現(xiàn)在開源已經(jīng)有接近甚至打平的選擇——整個(gè)行業(yè)的定價(jià)權(quán)和技術(shù)主導(dǎo)權(quán)正在從閉源巨頭流向開源社區(qū)。

從產(chǎn)業(yè)的深遠(yuǎn)角度看,短命的 " 老古董 " 大模型正在被靈活的 " 草臺(tái)班子 " 打敗。每一次迭代周期的壓縮,都帶來了企業(yè)自身的產(chǎn)業(yè)重估。

再也不是 " 買一個(gè)模型就能用十年 " 的時(shí)代了,一個(gè)開發(fā)團(tuán)隊(duì)今天剛基于某款模型規(guī)劃的系統(tǒng)架構(gòu),下周可能就面臨該模型大幅漲價(jià)、或被下一款更具性價(jià)比的開源模型徹底替代的殘酷現(xiàn)實(shí)。

結(jié)語

這一切動(dòng)蕩,都折射出一個(gè)深刻的行業(yè)真相:大模型技術(shù)從來不是 " 一片向好 " 的消費(fèi)榮景,而是一個(gè)動(dòng)態(tài)演進(jìn)、多方博弈的復(fù)雜生態(tài)系統(tǒng)。它的價(jià)格走向、迭代速度和服務(wù)模式,都在直接挑戰(zhàn)用戶層面的消費(fèi)心理極限。

無論是突然墜零的價(jià)格跳水,還是一夜翻倍的商業(yè)收割,都是市場(chǎng)走向成熟化路徑的陣痛信號(hào)。可以肯定的是,過去那種僅憑 " 沾上 AI 概念 " 就能獲得高溢價(jià)的寬松泡沫期,已經(jīng)宣告徹底結(jié)束。

AI 產(chǎn)業(yè)正在進(jìn)入一個(gè)全新的競(jìng)爭(zhēng)維度——以 "Token 經(jīng)濟(jì)效率 " 為核心的高滲透階段。如果一個(gè)模型的價(jià)格低于另外的同類競(jìng)爭(zhēng)品,它就能引爆資本與開發(fā)者社區(qū);如果一個(gè)模型能通過技術(shù)創(chuàng)新將算力成本壓到對(duì)方的一個(gè)零頭,它就能重新改寫行業(yè)定價(jià)的錨點(diǎn)。

在這種環(huán)境下,所有的 AI 競(jìng)爭(zhēng)對(duì)手都在進(jìn)行同等強(qiáng)度的競(jìng)爭(zhēng)壓力博弈:瘋狂上調(diào)價(jià)格以求從高投資中的算力資本抽回血本;再通過極速的技術(shù)迭代與降價(jià)手段摧毀對(duì)手的價(jià)格心防。

這種 " 漲價(jià)—降價(jià)—再漲價(jià) " 的魔性循環(huán),在大模型的 " 保質(zhì)期 " 內(nèi)頻繁上演,導(dǎo)致所有身處這條產(chǎn)業(yè)鏈上的開發(fā)者、投資人與用戶的 " 護(hù)城河 " 都有隨時(shí)被沖蝕的風(fēng)險(xiǎn)。

換個(gè)角度來看,大模型的 " 短保質(zhì)期 ",本質(zhì)上是一場(chǎng)效率倒計(jì)時(shí)。市場(chǎng)不再為 " 第一 " 買單,只為最能解決問題、最能壓出性價(jià)比的 " 長期托管方 " 買單。

對(duì)于普通用戶來說,現(xiàn)在最需要的不是相信天花亂墜的 AI 概念,而是辨別一個(gè)模型在什么樣的價(jià)格下、在多短的生命周期內(nèi),能給自己帶來真正的價(jià)值滿足。

如果說 2023 年的答案是 " 新鮮 ",2024 年的答案是 " 流量 ",那么走到今天這個(gè)節(jié)點(diǎn),最妥帖的答案或許是 " 平衡 " ——在砸錢購買 Token 時(shí),在投資應(yīng)用決策時(shí),能做到算得清賬、看得清局、守得住底線。

相關(guān)標(biāo)簽

相關(guān)閱讀

最新評(píng)論

沒有更多評(píng)論了

覺得文章不錯(cuò),微信掃描分享好友

掃碼分享

熱門推薦

查看更多內(nèi)容

企業(yè)資訊

查看更多內(nèi)容