
Anthropic 宣布,公司已完成 H 輪融資,融資金額達(dá) 650 億美元,投后估值為 9650 億美元。
這筆融資將被 Anthropic 用來(lái)繼續(xù)研發(fā),同時(shí)擴(kuò)大算力產(chǎn)能,滿足現(xiàn)在市場(chǎng)對(duì) Claude 越來(lái)越大的需求。


在 Claude Code 2.1.154 版本中,輸入 /model 后的模型選擇菜單里,Opus 一欄已經(jīng)更新為 Opus 4.8。



Opus 4.8 更新速覽
根據(jù) Anthropic 官方介紹,Opus 4.8 具有更敏銳的判斷力、對(duì)自身進(jìn)步的更誠(chéng)實(shí)的態(tài)度,以及更長(zhǎng)時(shí)間獨(dú)立工作的能力。
重要的是,價(jià)格保持不變。
常規(guī)價(jià)格仍是輸入 5 美元 / 百萬(wàn) token、輸出 25 美元 / 百萬(wàn) token;Fast mode 價(jià)格為輸入 10 美元 / 百萬(wàn) token、輸出 50 美元 / 百萬(wàn) token。
Opus 4.8 的 Fast mode 速度大約是標(biāo)準(zhǔn)模式的 2.5 倍;同時(shí),F(xiàn)ast mode 這次降價(jià)后,價(jià)格約為此前 Fast mode 的三分之一。

官方在新聞稿末尾是這么寫的:"Opus 4.8 相比 Opus 4.7,并沒有很夸張的提升,更多的是那種用戶真正用起來(lái)后,才能感受到的細(xì)節(jié)升級(jí)。"
Anthropic 還提到,公司正在開發(fā)一類成本更低、但能力接近 Opus 的模型。同時(shí)也計(jì)劃推出比 Opus 更強(qiáng)的新類型模型,就是公開的秘密—— Mythos。

Anthropic 這次尤其強(qiáng)調(diào),Opus 4.8 變得更誠(chéng)實(shí)了。
所謂誠(chéng)實(shí),不只是少胡說(shuō),而是模型在自己拿不準(zhǔn)的時(shí)候,更愿意把不確定性說(shuō)出來(lái);在沒有足夠證據(jù)時(shí),也更少?gòu)?qiáng)行給出一個(gè)看似確定的結(jié)論。
Anthropic 稱,在內(nèi)部評(píng)測(cè)中,Opus 4.8 如果寫出了有問題的代碼,更可能主動(dòng)指出問題,而不是假裝一切正常。相比上一代,它 " 發(fā)現(xiàn)自己代碼缺陷卻不說(shuō) " 的情況大約減少了四分之三。

這延續(xù)了 Anthropic 最近一貫的姿態(tài)。無(wú)論是強(qiáng)調(diào) Opus 4.8 更愿意承認(rèn)不確定性,還是回應(yīng)《人性的偉大之處》里關(guān)于 AI 與人類尊嚴(yán)的討論,Anthropic 都在反復(fù)傳遞同一個(gè)信號(hào):模型越能干,越不能只是聽話和自信,它必須知道邊界,承認(rèn)不確定性,并且盡量維護(hù)用戶的真實(shí)利益。
這種敘事可以增強(qiáng)用戶對(duì)于 Anthropic 模型的信任,促進(jìn)企業(yè)合作,也有助于 Anthropic 為未來(lái) IPO 鋪路。
Opus 4.8 發(fā)布的同時(shí),Anthropic 還推出了幾項(xiàng)功能更新,其中最重要的是動(dòng)態(tài)工作流,Anthropic 專門發(fā)了一篇文章來(lái)介紹。

按照 Anthropic 的說(shuō)法,它可以讓 Claude Code 處理更大規(guī)模的問題。Claude 會(huì)先規(guī)劃工作,再在一個(gè)會(huì)話里運(yùn)行數(shù)百個(gè)并行 subagents,最后在向用戶匯報(bào)前驗(yàn)證輸出。配合 Opus 4.8,這些 agents 可以運(yùn)行更久,更適合代碼遷移、全庫(kù)排查、長(zhǎng)期重構(gòu)這類需要持續(xù)推進(jìn)的異步工作流。
官方舉的例子是,Claude Code 現(xiàn)在可以完成跨數(shù)十萬(wàn)行代碼庫(kù)的遷移任務(wù),從啟動(dòng)一直推進(jìn)到合并,并使用項(xiàng)目原有的測(cè)試套件來(lái)檢查結(jié)果。

Claude Code 里過去已經(jīng)有類似的 effort 控制,用 /effort 可以調(diào)不同的思考強(qiáng)度,現(xiàn)在 claude.ai 和 Claude Cowork 現(xiàn)在也有了這個(gè)控制項(xiàng),用戶可以在模型選擇器旁邊直接調(diào) Claude 對(duì)一次回答投入多少 effort。
低 effort 的情況下 Claude 就回得更快、消耗更少;高 effort 就是讓它多花一些 token,把問題想得更細(xì),更適合那種復(fù)雜的任務(wù)。
在 Claude Code 里,Opus 4.8 默認(rèn)使用高 effort 模式。Anthropic 的意思是,這樣能在質(zhì)量和速度之間取得比較好的平衡。做代碼任務(wù)時(shí),它的 token 消耗和 Opus 4.7 默認(rèn)模式差不多,但完成效果更好。
還有一個(gè)更偏開發(fā)者的小更新,Messages API 現(xiàn)在支持在 messages 數(shù)組里插入 system 條目了。你可以在任務(wù)執(zhí)行過程中更新 Claude 的系統(tǒng)指令,不用打斷 prompt 緩存,非常適合長(zhǎng)流程任務(wù)。
動(dòng)態(tài)工作流
比起模型性能,本次更新的重中之重,就是前文提到的 Claude Code 的動(dòng)態(tài)工作流。

而這,就是動(dòng)態(tài)工作流的核心。
以前你讓 Claude Code 做一個(gè)復(fù)雜任務(wù),它是用一個(gè)主 Agent,一步步讀代碼、改代碼、跑測(cè)試、再修。
問題是,大型工程任務(wù)往往太大。一個(gè) bug 可能關(guān)聯(lián)幾十個(gè)文件,一次遷移可能要改幾百個(gè)文件。單個(gè) Agent 一條線往下跑,容易漏東西,也容易中途跑偏。
動(dòng)態(tài)工作流要做的事情就是調(diào)度,類似于客戶經(jīng)理。它不干活,但是它安排合適的人干活。
Claude 先把你的任務(wù)拆成一套工作流,然后自動(dòng)拉起幾十到幾百個(gè)并行的子 Agent。每個(gè)子 Agent 負(fù)責(zé)一個(gè)子任務(wù),比如掃某個(gè)模塊、驗(yàn)證某個(gè)結(jié)論、找反例、跑測(cè)試這些。
最后 Claude 再把這些結(jié)果匯總、交叉驗(yàn)證,給你一個(gè)統(tǒng)一答案。
它的核心不是讓一個(gè) Agent 更聰明,是讓 Claude 自動(dòng)組織一群 Agent 一起干活。
官方舉的例子是 Bun 從 Zig 到 Rust 的遷移試驗(yàn),動(dòng)態(tài)工作流參與了約 75 萬(wàn)行 Rust 代碼遷移,11 天內(nèi)從首次提交推進(jìn)到合并,并讓 99.8% 的既有測(cè)試套件通過。
但與之相對(duì)的,成本也增加了。官方特意提醒,動(dòng)態(tài)工作流會(huì)明顯消耗更多 token,第一次觸發(fā)時(shí)會(huì)讓用戶確認(rèn);Enterprise 管理員也可以選擇直接禁用。
4.7 到 4.8,只相隔了 42 天
如果按公開發(fā)布時(shí)間算,Opus 4.5 的發(fā)布日期是 2025 年 11 月 24 日,Opus 4.6 是 2026 年 2 月 5 日,兩者相隔 73 天;Opus 4.7 是 2026 年 4 月 16 日,距離 4.6 相隔 70 天;Opus 4.8 是 2026 年 5 月 28 日,距離 4.7 只有 42 天。
為什么這么快?
網(wǎng)上普遍認(rèn)為是 4.7 沒有達(dá)到用戶預(yù)期。
Anthropic 發(fā)布 4.7 的時(shí)候說(shuō),它能把更難的編程任務(wù)交給模型,并且模型還能在匯報(bào)前驗(yàn)證結(jié)果。
但不少用戶反饋稱,4.7 只是會(huì)簡(jiǎn)單搜索一下就直接下結(jié)論,也沒有真正地交叉驗(yàn)證結(jié)果。AMD AI 負(fù)責(zé)人絲黛拉 · 勞倫佐(Stella Laurenzo)表示,Claude Code 在使用 4.7 做大型工程時(shí),很容易跑偏。
如果只是模型性能沒達(dá)標(biāo)也就算了,問題是官方自己也承認(rèn),4.7 的 tokenizer 會(huì)讓同樣輸入變成約 1.0 到 1.35 倍 token,同時(shí)高 effort 下會(huì)花更多 token。
等于說(shuō)錢多花了,結(jié)果沒有提升,甚至還下降了。
從官方和早期測(cè)試者的說(shuō)法看,4.8 至少瞄準(zhǔn)了幾個(gè) 4.7 的痛點(diǎn),比如工具調(diào)用、長(zhǎng)任務(wù)穩(wěn)定性、代碼缺陷自檢、回復(fù)噪音,以及在不確定時(shí)硬撐結(jié)論的問題。
但要說(shuō) " 完全解決 ",還太早,還得等后續(xù)各種大型工程項(xiàng)目的反饋結(jié)果出來(lái)才能看清楚。
關(guān)鍵在于,Anthropic 現(xiàn)在可不是追趕者了,它是領(lǐng)跑者。
就在 4.8 發(fā)布的前一天,外媒報(bào)道稱,Anthropic 目前的收入很可能已經(jīng)比 OpenAI 至少高出 35%。
Anthropic 年化收入接近 450 億美元,OpenAI 約為 330 億美元。雖然 ARR 不等同于最終利潤(rùn),但足以改變市場(chǎng)敘事。
這兩家公司都是準(zhǔn)備在 2026 年下半年 IPO 的,如果 Anthropic 先過會(huì),那 OpenAI 的故事就不好講了。
這也讓 Opus 4.8 多了一層含義。它是在給資本市場(chǎng)遞材料,證明 4.7 雖然不行,但是 Anthropic 能立馬推出新版本,以支撐自己超高的估值和收入。
本文來(lái)自微信公眾號(hào):字母 AI,作者:袁心玥、苗正