雷火最新网址,雷火电竞APP客户端下载

今年 Anthropic 的勢(shì)頭異常兇猛。

不僅熱度居高不下，口碑也持續(xù)攀升，穩(wěn)坐 AI 圈「頂流」的交椅?，F(xiàn)在幾乎每天醒來(lái)，都能看到他們準(zhǔn)點(diǎn)推送的新產(chǎn)品或新功能。久而久之，大家也從興奮變成了「是你，果然又是你」的默契感。

而就在剛剛，萬(wàn)眾期待的 Claude Opus 4.7 也正式發(fā)布，依舊是熟悉的配方，熟悉的高分選手。

有趣的是，Anthropic 在公告里非常坦誠(chéng)，甚至帶著點(diǎn)驕傲：「這并非我們最強(qiáng)大的模型?！鼓莻€(gè)傳說(shuō)強(qiáng)得可怕的 Claude Mythos Preview 依然還在藏。

但就是這個(gè)并非最強(qiáng)的 Opus 4.7，卻依舊引發(fā)了極大的關(guān)注。因?yàn)樗鉀Q了一個(gè)比聰明更重要的痛點(diǎn)：靠譜。不是那種你說(shuō)什么它就做什么的靠譜，而是當(dāng)你提出一個(gè)愚蠢的方案時(shí)，它敢于反駁你，并自己把坑填上的靠譜。

當(dāng)靠譜成為比聰明更稀缺的品質(zhì)

基準(zhǔn)測(cè)試結(jié)果顯示，在業(yè)界公認(rèn)最硬核的 SWE-bench Pro 上，4.7 從前代的 53.4% 直接拉到 64.3%，單代升級(jí)漲了近 11 個(gè)百分點(diǎn)，把 GPT-5.4（57.7%）和 Gemini 3.1 Pro（54.2%）都甩在了身后。

視覺(jué)推理的 CharXiv 基準(zhǔn)從 69.1% 跳到 82.1%，對(duì)應(yīng)的是它新獲得的 2576 像素長(zhǎng)邊識(shí)別能力——清晰度是前代的 3 倍以上。

這不只是「看得更清楚」這么簡(jiǎn)單。更高的分辨率直接帶動(dòng)了輸出質(zhì)量的連鎖提升：生成界面、制作幻燈片、排版文檔，細(xì)節(jié)精度也全面提升。

工具調(diào)用規(guī)?；u(píng)測(cè) MCP-Atlas 上，4.7 跑出 77.3%，超過(guò) GPT-5.4 的 68.1% 和 Gemini 的 73.9%。法律 AI 平臺(tái) Harvey 測(cè)試中，4.7 在 BigLaw 基準(zhǔn)上拿下 90.9%，正確區(qū)分了歷來(lái)是前沿模型死穴的「轉(zhuǎn)讓條款」與「控制權(quán)變更條款」。

不過(guò)，4.7 也并非全然遙遙領(lǐng)先，在 Agentic search 評(píng)測(cè) BrowseComp 上，4.7 反而從前代的 83.7% 下降到了 79.3%，被 GPT-5.4（89.3%）和 Gemini（85.9%）超越。

這個(gè)退步并非偶然。一個(gè)遇到缺失信息會(huì)直接報(bào)錯(cuò)、不肯亂編答案的 Agent，在以「是否給出答案」為評(píng)判標(biāo)準(zhǔn)的基準(zhǔn)上，天然會(huì)吃虧。

而數(shù)據(jù)之外，更值得關(guān)注的問(wèn)題是：這種「靠譜」，在真實(shí)工作里到底意味著什么？

過(guò)去一年，業(yè)界對(duì)代碼大模型的期待，普遍還停留在「寫(xiě)個(gè)函數(shù)、找個(gè) Bug」的層面，但 Claude 4.7 在早期測(cè)試?yán)铮宫F(xiàn)出了一種截然不同的氣質(zhì)。

知名云端開(kāi)發(fā)平臺(tái) Replit 的負(fù)責(zé)人這樣描述：「它在技術(shù)討論中會(huì)反駁我，幫我做出更好的決定。它真的感覺(jué)像一個(gè)更好的同事?！?/p>

它不再一味地「唯命是從」，也不再為了交差而胡編亂造。在數(shù)據(jù)科學(xué)平臺(tái) Hex 的測(cè)試?yán)铮?.7 遇到缺失數(shù)據(jù)時(shí)會(huì)直接報(bào)錯(cuò)，而不是像前代那樣塞一個(gè)「看似合理但完全錯(cuò)誤」的備選值。Hex 團(tuán)隊(duì)甚至直言：「低消耗狀態(tài)下的 4.7，等同于中等消耗狀態(tài)下的 4.6?！?/p>

這種「拒絕順從」的特質(zhì)，恰恰是高級(jí)軟件工程里最稀缺的東西。

當(dāng)然，凡事有兩面。為舊模型寫(xiě)的 prompt，到了 4.7 手里可能會(huì)產(chǎn)生意想不到的結(jié)果。那些過(guò)去被模型「意會(huì)」掉的模糊指令，4.7 會(huì)一字一字地字面執(zhí)行。這也意味著越懂得清楚表達(dá)需求的人，越能從 4.7 這里拿到好結(jié)果。

光會(huì)「頂嘴」還不夠，遇到挫折就罷工的 AI 同樣不是好同事。4.7 的另一個(gè)大的變化，是任務(wù)韌性。

以往大模型在多步任務(wù)中遇到工具調(diào)用失敗，往往直接停機(jī)報(bào)錯(cuò)。Notion 團(tuán)隊(duì)測(cè)試發(fā)現(xiàn)，4.7 的工具錯(cuò)誤率降到了原來(lái)的三分之一，更關(guān)鍵的是，它能在工具鏈崩潰時(shí)自己繞過(guò)障礙，繼續(xù)把任務(wù)跑完。

當(dāng) AI 停止諂媚，真正的生產(chǎn)力才開(kāi)始爆發(fā)。

Anthropic 公布的一個(gè)極端案例里，4.7 在沒(méi)有任何人類(lèi)干預(yù)的情況下，從零構(gòu)建了一個(gè)完整的 Rust 文本轉(zhuǎn)語(yǔ)音引擎——寫(xiě)神經(jīng)網(wǎng)絡(luò)模型、SIMD 內(nèi)核和瀏覽器演示，還自己把輸出喂給語(yǔ)音識(shí)別器做驗(yàn)證，連測(cè)試都一并完成了。

前端框架巨頭 Vercel 還發(fā)現(xiàn)了一個(gè)過(guò)去從未有過(guò)的行為：4.7 會(huì)在開(kāi)始寫(xiě)系統(tǒng)級(jí)代碼之前，先自己進(jìn)行數(shù)學(xué)證明。這已經(jīng)超出了寫(xiě)代碼的范疇，進(jìn)入了嚴(yán)謹(jǐn)工程設(shè)計(jì)的領(lǐng)域。

雇傭 AI「資深專(zhuān)家」的代價(jià)

為了驗(yàn)證它在細(xì)節(jié)上的處理能力，我設(shè)定了三個(gè)前端交互場(chǎng)景，評(píng)判標(biāo)準(zhǔn)只有一個(gè)：細(xì)節(jié)是否敷衍，一眼便知。

第一個(gè)場(chǎng)景，是讓它做一個(gè)俯視視角的黑膠唱片機(jī)界面，其難點(diǎn)在于「金屬光澤」與「呼吸光暈」的呈現(xiàn)。4.7 并沒(méi)有用廉價(jià)的色彩漸變敷衍了事，而是通過(guò)復(fù)雜的 CSS 樣式疊加，逼真地還原了金屬質(zhì)感。

第二個(gè)場(chǎng)景是只用 CSS，不用 JavaScript 做一個(gè)老式電風(fēng)扇。面對(duì)這個(gè)限制嚴(yán)格的題目，一些模型會(huì)悄悄違規(guī)使用 JS，但 4.7 遵守了規(guī)則。它用純 CSS 做出了風(fēng)扇的立體結(jié)構(gòu)，低中高三檔過(guò)渡流暢，底座透視和陰影的處理也真有一點(diǎn)實(shí)物感，它在規(guī)則允許的范圍內(nèi)找到了很好的解決辦法。

第三個(gè)場(chǎng)景是做一個(gè)復(fù)古磁帶隨身聽(tīng)，帶有錄像帶那種老舊的噪點(diǎn)效果。磁帶轉(zhuǎn)動(dòng)的細(xì)節(jié)也是有的。

當(dāng)然，變聰明是有代價(jià)的。Opus 4.7 現(xiàn)已在所有 Claude 產(chǎn)品和 API、Amazon Bedrock、Google Cloud 的 Vertex AI 以及 Microsoft Foundry 平臺(tái)上推出。

基礎(chǔ)定價(jià)維持在每百萬(wàn)輸入 5 美元、輸出 25 美元不變。但 4.7 引入了全新分詞器，同樣的文本會(huì)拆分出比原來(lái)多 1.0 到 1.35 倍的 Token。

疊加上它在高強(qiáng)度任務(wù)中本身就傾向于「多想一會(huì)兒」，實(shí)際消耗幾乎必然上升。

此外，Anthropic 在原有的難度選項(xiàng)之上，加入了全新的 xhigh（超高）級(jí)別。在這個(gè)級(jí)別下，面對(duì)復(fù)雜難題，Claude 4.7 會(huì)消耗更多的 Token，花更多的時(shí)間去「思考」。Claude Code 已經(jīng)把所有套餐的默認(rèn) effort level 直接拉到了 xhigh。

Anthropic 用行動(dòng)告訴所有人，對(duì)于真正的編碼任務(wù)，省著用不如想清楚。

為了匹配這種工作流，Claude Code 順勢(shì)推出了兩個(gè)殺手級(jí)功能：

/ultrareview（深度審查）：開(kāi)啟一個(gè)專(zhuān)門(mén)的審查會(huì)話，像一個(gè)極其挑剔的資深 Reviewer 一樣，通讀所有代碼更改，精準(zhǔn)標(biāo)記出深層的架構(gòu)設(shè)計(jì)缺陷和 Bug。Pro 和 Max 用戶(hù)可以免費(fèi)試用三次。

Auto Mode（自動(dòng)模式）擴(kuò)展到 Max 用戶(hù)：一種介于「逐項(xiàng)授權(quán)」和「跳過(guò)所有權(quán)限」之間的新權(quán)限模式。Claude 會(huì)在你授權(quán)的范圍內(nèi)自主做決策，既能跑完漫長(zhǎng)無(wú)聊的任務(wù)，又比完全放權(quán)更安全。

為了防止這個(gè)「太能思考」的 AI 把賬戶(hù)余額刷爆，API 端還推出了「任務(wù)預(yù)算」（Task Budgets）功能公測(cè)版，讓開(kāi)發(fā)者可以顯式規(guī)劃 Claude 在長(zhǎng)任務(wù)中的 Token 支出優(yōu)先級(jí)。

當(dāng)然，4.7 并不是 Anthropic 手里最強(qiáng)的牌。

那個(gè)更強(qiáng)的 Claude Mythos Preview，本月剛以「Project Glasswing」的名義，小范圍開(kāi)放給了一批企業(yè)用于網(wǎng)絡(luò)安全研究。Mythos 沒(méi)有公開(kāi)發(fā)布，原因則是因?yàn)樗木W(wǎng)絡(luò)攻防能力太強(qiáng)，Anthropic 覺(jué)得還沒(méi)想清楚怎么安全地推給所有人。

4.7 本身也做了主動(dòng)取舍，訓(xùn)練階段就壓低了網(wǎng)絡(luò)攻防能力，內(nèi)置自動(dòng)攔截機(jī)制，碰到高風(fēng)險(xiǎn)請(qǐng)求直接擋掉。有合規(guī)需求的安全研究人員，可以通過(guò)官方渠道單獨(dú)申請(qǐng)。

不急著把最強(qiáng)的牌打出去，和不停地往桌上加新牌，背后是同一套邏輯。實(shí)際上，Anthropic 真正的護(hù)城河，是交付節(jié)奏本身。

在今年 2 月 1 日至 3 月 24 日，短短 52 天里，Anthropic 一共更新了 74 款產(chǎn)品，平均不到兩天一個(gè)。Cowork、插件……這些動(dòng)作扎扎實(shí)實(shí)地?fù)糁辛寺殘?chǎng)辦公的痛點(diǎn)。

如今的 Claude 生態(tài)，早就超越了單純的「聊天機(jī)器人」。對(duì)于那些渴望將 AI 深度嵌入實(shí)際工作流的團(tuán)隊(duì)而言，這種穩(wěn)定、高頻且可預(yù)期的更新節(jié)奏，才是最讓人感到踏實(shí)的定心丸。

今天發(fā)布的 Claude 4.7，是這條鏈條上最新的一塊壓艙石。而那個(gè) Mythos Preview，遲早也會(huì)來(lái)。到那時(shí)候，我們現(xiàn)在覺(jué)得已經(jīng)很能打的 4.7，可能只是個(gè)開(kāi)端。

电竞比分网-中国电竞赛事及体育赛事平台

宙世代元宇宙

元宇宙黨建解決方案

元宇宙文旅解決方案

元宇宙展廳解決方案

元宇宙行業(yè)峰會(huì)解決方案

元宇宙營(yíng)銷(xiāo)解決方案

元宇宙會(huì)展解決方案

元宇宙演藝節(jié)目解決方案

元宇宙博物館解決方案

元宇宙圖書(shū)館解決方案

元宇宙校園解決方案

元宇宙企業(yè)展廳解決方案

元宇宙藝術(shù)展解決方案

元宇宙電商解決方案

融媒體解決方案

ZAKER智慧云

媒體解決方案

黨建解決方案

公檢法解決方案

智慧交通解決方案

高校解決方案

AI視頻

AI視頻剪輯

視頻定制服務(wù)

AI智能客服

我的訂閱

剛剛，Claude Opus 4.7 突然發(fā)布：不是最強(qiáng)，但奧特曼又得失眠

宙世代

一起剪

相關(guān)閱讀

黃仁勛最新深度分享：英偉達(dá)的護(hù)城河、TPU威脅與生態(tài)建設(shè)

追覓科技受邀出席國(guó)家商務(wù)部中意企委會(huì)圓桌會(huì)，作為中方企業(yè)代表發(fā)言

延遲低至0.125ms！微星發(fā)布首款8kHz回報(bào)率無(wú)線鼠標(biāo)：66g輕量化設(shè)計(jì)+196小時(shí)長(zhǎng)續(xù)航

全球70%產(chǎn)能在手，中國(guó)生物制造如何邁向科學(xué)紅利？

AMD銳龍AI 5 430實(shí)測(cè)成績(jī)出爐：?jiǎn)魏颂嵘?0%、核顯翻倍但仍不夠打

最強(qiáng)創(chuàng)業(yè)團(tuán)誕生！蘋(píng)果M1之父攜高通、Nuvia芯片大神成立新CPU公司：重寫(xiě)芯片規(guī)則

算力通脹元年：DeepSeek越便宜，這輪漲價(jià)越難停

庫(kù)克都沒(méi)想到：MacBook Neo賣(mài)爆了！官網(wǎng)交付已排到5月

“華為天才少年”創(chuàng)業(yè)連融超4億元，做新一代推理芯片重構(gòu)顯存成本

6只股票：可從AI數(shù)據(jù)中心對(duì)海量用水需求中受益

雷軍開(kāi)啟新SU7長(zhǎng)途續(xù)航挑戰(zhàn)15小時(shí)直播 呼吁網(wǎng)友服務(wù)區(qū)碰到可以能打呼 高速上千萬(wàn)別跟車(chē)

X3D鼻祖回歸！AMD確認(rèn)銳龍7 5800X3D Q2上市：AM4十周年紀(jì)念

蘇媽YES！AMD市值3.1萬(wàn)億登上巔峰 Intel恢復(fù)25年來(lái)最高

突破卡脖子！國(guó)內(nèi)首顆車(chē)規(guī)級(jí)先進(jìn)制程多域融合芯片“紅旗1號(hào)”問(wèn)世

如果不會(huì)卡進(jìn)沙石，建議再試試鏤空中底？

最新評(píng)論

愛(ài)范兒

熱門(mén)推薦

企業(yè)資訊

剛剛，Claude Opus 4.7 突然發(fā)布：不是最強(qiáng)，但奧特曼又得失眠

黃仁勛最新深度分享：英偉達(dá)的護(hù)城河、TPU威脅與生態(tài)建設(shè)

追覓科技受邀出席國(guó)家商務(wù)部中意企委會(huì)圓桌會(huì)，作為中方企業(yè)代表發(fā)言

全球70%產(chǎn)能在手，中國(guó)生物制造如何邁向科學(xué)紅利？

AMD銳龍AI 5 430實(shí)測(cè)成績(jī)出爐：?jiǎn)魏颂嵘?0%、核顯翻倍但仍不夠打

最強(qiáng)創(chuàng)業(yè)團(tuán)誕生！蘋(píng)果M1之父攜高通、Nuvia芯片大神成立新CPU公司：重寫(xiě)芯片規(guī)則

算力通脹元年：DeepSeek越便宜，這輪漲價(jià)越難停

“華為天才少年”創(chuàng)業(yè)連融超4億元，做新一代推理芯片重構(gòu)顯存成本

雷軍開(kāi)啟新SU7長(zhǎng)途續(xù)航挑戰(zhàn)15小時(shí)直播呼吁網(wǎng)友服務(wù)區(qū)碰到可以能打呼高速上千萬(wàn)別跟車(chē)

X3D鼻祖回歸！AMD確認(rèn)銳龍7 5800X3D Q2上市：AM4十周年紀(jì)念

蘇媽YES！AMD市值3.1萬(wàn)億登上巔峰 Intel恢復(fù)25年來(lái)最高

如果不會(huì)卡進(jìn)沙石，建議再試試鏤空中底？