电竞比分网-中国电竞赛事及体育赛事平台

關(guān)于ZAKER 合作
鈦媒體 10小時(shí)前

Claude 故意降智,模型也開(kāi)始“看人下菜碟”?

文 | 世界模型工場(chǎng)

Claude 降智了?

近日,AMD AI 集團(tuán)高級(jí)總監(jiān) Stella Laurenzo 向 Anthropic 開(kāi)炮。

她用團(tuán)隊(duì)真實(shí)生產(chǎn)日志,對(duì) 6,852 個(gè)會(huì)話文件中的 17,871 個(gè)思考?jí)K、234,760 次工具調(diào)用做了回溯分析。

數(shù)據(jù)顯示,Claude 從 2 月中旬開(kāi)始出現(xiàn)了明顯的行為退化。

Claude 的思考中位數(shù)從 2200 字符暴跌至 600 字符,下降 67%-73%;

編輯前閱讀文件次數(shù)從 6.6 次銳減到 2 次,甚至三分之一的修改完全不讀文件就直接動(dòng)手。

Stella 在分析中指出,由于推理能力下降,模型在修改代碼之前逐漸不再完整閱讀代碼。

她寫(xiě)道:" 當(dāng)思考流于表面時(shí),模型會(huì)默認(rèn)采取成本最低的操作 "。

這不是個(gè)例,早在 3 月份,開(kāi)發(fā)者們的不滿已經(jīng)開(kāi)始集中爆發(fā)。

在 X 上,有用戶寫(xiě)道:" 我還以為最近幾周 Claude 是我自己瘋了。它感覺(jué)更慢、更懶,像回答前就不思考了,結(jié)果我沒(méi)幻覺(jué) "。

Reddit 上也有用戶抱怨:"Claude 感覺(jué)沒(méi)那么有意識(shí)了,像被做了腦葉切除術(shù)。除了變笨,它還開(kāi)始不問(wèn)就擅自做極端操作…… "。

還有人表示這是 Anthropic 對(duì)用戶赤裸裸的背刺:" 他們只是把問(wèn)題對(duì)我們所有用戶變得不可見(jiàn),就是覺(jué)得‘你量不到我就不給你看’……這就是 AI 實(shí)驗(yàn)室優(yōu)化利潤(rùn)而不是輸出質(zhì)量的下場(chǎng) "。

從用戶吐槽到數(shù)據(jù)實(shí)錘,基本坐實(shí)了 Claude 的降智行為。

而 Anthropic 的官方回應(yīng),也默認(rèn)了思考深度和 effort 確實(shí)在被持續(xù)調(diào)整。

如果這是 Anthropic 有意而為之,那是不是意味著,以后模型能力會(huì)在不知不覺(jué)中 " 縮水 "?

又或者,最強(qiáng)的模型能力,將不再平等地提供給所有人?

Claude 降智 " 有意為之 "

Claude Opus 4.6 和其編碼專用模式 Claude Code,在 2026 年 1 月推出時(shí),曾被開(kāi)發(fā)者奉為編碼天花板。

它思考深度驚人、research-first(先調(diào)研再動(dòng)手),長(zhǎng)上下文處理穩(wěn)定,多文件重構(gòu)幾乎無(wú)敵。

AMD 內(nèi)部團(tuán)隊(duì)甚至用它在周末就把 19 萬(wàn)行遺留代碼全部 merge 上線,生產(chǎn)力直接拉滿。

然而轉(zhuǎn)折發(fā)生在 2 月初。

Anthropic 低調(diào)推出 "adaptive thinking" 功能,官方描述是 " 讓模型根據(jù)任務(wù)復(fù)雜度智能調(diào)整思考深度 "。

表面上看是用戶友好,實(shí)則開(kāi)啟了全局節(jié)流開(kāi)關(guān)。

3 月初,模型默認(rèn) effort 值被悄然降至 medium,同時(shí)思考過(guò)程摘要被快速隱藏,用戶再也無(wú)法一眼看出模型到底想了多深。

同一時(shí)期,Anthropic 連續(xù)發(fā)布 14 個(gè)小版本更新,卻遭遇 5 次大規(guī)模宕機(jī),顯示出算力和負(fù)載壓力已經(jīng)逼近極限。

開(kāi)發(fā)者反饋開(kāi)始集中爆發(fā),有人注意到高峰期(美東下午)表現(xiàn)尤其差,懷疑是負(fù)載動(dòng)態(tài)節(jié)流。

直到 4 月份 AMD AI 總監(jiān)親自下場(chǎng),用數(shù)據(jù)實(shí)錘徹底引爆了輿論。

至此,Anthropic 的 Claude Code 負(fù)責(zé)人 Boris Cherny 才不得不發(fā)布了一條官方回復(fù)。

他表示,"adaptive thinking" 影響的是 thinking 的顯示,而不是底層推理,并堅(jiān)持這是 " 有意優(yōu)化 " 而非 bug。用戶若想改善效果,可以手動(dòng)把 effort 調(diào)到 high。

Anthropic 的潛臺(tái)詞很清楚:降智不是 bug,是我們特意做的產(chǎn)品優(yōu)化,你們自己調(diào)參數(shù)就行。

這番回應(yīng)瞬間點(diǎn)燃了更大的怒火。

關(guān)鍵在于,從 2 月中旬到 4 月初,Anthropic 從未提前公告任何重大變更。

大量付費(fèi)用戶在毫不知情的情況下,訂閱費(fèi)用一分沒(méi)少,模型卻被悄然節(jié)流。

所以 Claude 的降智并不是模型 " 腦子壞了 ",而是 Anthropic 在做一種更隱蔽、也更商業(yè)化的動(dòng)作:

通過(guò)調(diào)低默認(rèn)思考深度,去換更快的速度、更低的負(fù)載和 GPU 成本。

模型能力分層

這場(chǎng)降智風(fēng)暴的背后,其實(shí)有一個(gè)值得警惕的現(xiàn)象:

模型能力已經(jīng)開(kāi)始分層。

Stella 的測(cè)算很直白:按 AWS Bedrock 的 on-demand 定價(jià)口徑,她團(tuán)隊(duì) 3 月的實(shí)際推理成本約為 42,121 美元,而同月實(shí)際支付的 Claude Code 訂閱費(fèi)只有 400 美元。

這個(gè)差額至少說(shuō)明,在極端重度使用場(chǎng)景下,訂閱制收費(fèi)與真實(shí)算力消耗之間存在巨大缺口。

這很有可能是 Anthropic 用資本燒錢(qián)換來(lái)的市場(chǎng)份額,但這種補(bǔ)貼是有邊界的。

當(dāng)重度用戶的推理消耗達(dá)到某個(gè)閾值,商業(yè)模式的可持續(xù)性就開(kāi)始動(dòng)搖。

Boris Cherny 在回應(yīng)中透露了一個(gè)關(guān)鍵信號(hào):Anthropic 正在測(cè)試為 Teams 和 Enterprise 用戶默認(rèn)開(kāi)啟 high effort 模式。

換句話說(shuō),更強(qiáng)的推理正在被當(dāng)成一種更昂貴的資源來(lái)分層配置,不再是人人默認(rèn)平等獲得的能力。

這意味著大模型的商業(yè)模式將進(jìn)一步分化。

如今 Anthropic 公司 80% 營(yíng)收來(lái)自企業(yè)服務(wù)和 API 調(diào)用,高粘性 B 端才是真正的命脈。

當(dāng)下 Anthropic 的種種動(dòng)作,都是為了把企業(yè)使用往自己的第一方平臺(tái)里收。

對(duì)于高價(jià)值的 B 端客戶,Anthropic 大概率會(huì)加速推出更強(qiáng)的企業(yè)級(jí)版本,為支付真實(shí)成本的企業(yè)客戶提供完整的模型能力。

而 C 端月付用戶,只能繼續(xù)享用 " 夠用就好 " 的降智版,滿足聊天、寫(xiě)文案、代碼補(bǔ)全等輕量化需求,但絕不觸及成本紅線。

至于中間地帶,那些既需要復(fù)雜推理、又無(wú)力承擔(dān)企業(yè)定價(jià)的獨(dú)立開(kāi)發(fā)者、小型團(tuán)隊(duì),將成為最受擠壓的群體。

有用戶在 X 上發(fā)帖證實(shí):

"Claude 企業(yè)版 API 的表現(xiàn)比 Pro/Max 訂閱好得多。用同一個(gè)測(cè)試框架測(cè)試,企業(yè)版和 Pro/Max 的行為方式就是不一樣。但這也意味著現(xiàn)在每個(gè)月要花 4-12k 美元,具體取決于我同時(shí)運(yùn)行多少個(gè)線程 "。

也就是說(shuō),未來(lái)大模型的商業(yè)化路徑,大概率是 B 端優(yōu)先、C 端降本。

誰(shuí)來(lái)為降智買(mǎi)單?

Claude 的降智事件,絕非孤例,而是整個(gè) AI 行業(yè)進(jìn)入商業(yè)化下半場(chǎng)的縮影。

無(wú)論是 OpenAI 對(duì) GPT 系列多次暗地縮水降級(jí),還是 Google 對(duì) Gemini 靜默限流,都在重復(fù)同一個(gè)劇本:

先用高性能吸引用戶上鉤,再通過(guò)軟件節(jié)流控制成本。

必然的結(jié)果就是,B 端能用高價(jià)買(mǎi)到更強(qiáng)模型,外加 SLA 保障,而 C 端則拿到蒸餾版、低 effort 版的平民模型。

C 端模型增智的速度,已經(jīng)明顯落后于 B 端。

更嚴(yán)重的是,這種分化是隱性的。

Anthropic 等廠商正在以一種難以察覺(jué)的方式降低推理預(yù)算,普通用戶不會(huì)收到任何提示。

這種選擇在短期內(nèi)或許能緩解算力成本壓力,但長(zhǎng)期代價(jià)是品牌信任度的喪失。

當(dāng) Claude 會(huì)偷偷降智成為用戶共識(shí),Anthropic 失去的將不僅僅是幾個(gè)重度用戶,而是整個(gè)生態(tài)系統(tǒng)對(duì) AI 普惠、透明敘事的信心。

更宏觀地看,Claude 事件是 AI 行業(yè)從野蠻生長(zhǎng)轉(zhuǎn)向精耕細(xì)作的縮影。

補(bǔ)貼期結(jié)束了,真實(shí)成本開(kāi)始顯現(xiàn),誰(shuí)來(lái)承擔(dān)這些成本?

是像這樣壓縮 C 端體驗(yàn)、提高 B 端定價(jià),還是等待軟硬件革命帶來(lái)效率突破,這都將決定未來(lái)五年 AI 應(yīng)用的格局。

未來(lái)趨勢(shì)已初見(jiàn)苗頭,AI 不再是越來(lái)越聰明的普惠神話,而是走向精英化分層。

相關(guān)標(biāo)簽

相關(guān)閱讀

最新評(píng)論

沒(méi)有更多評(píng)論了

覺(jué)得文章不錯(cuò),微信掃描分享好友

掃碼分享

熱門(mén)推薦

查看更多內(nèi)容

企業(yè)資訊

查看更多內(nèi)容