

據(jù)官方披露,早期測(cè)試反饋顯示,Opus 4.8 在執(zhí)行代理任務(wù)時(shí)表現(xiàn)出更高的可靠性和更敏銳的判斷力。評(píng)估數(shù)據(jù)指出,該模型在生成代碼時(shí),缺陷漏報(bào)率較前代降低了約四倍。此外,測(cè)試中的欺騙行為和偏差率也有所下降,在衡量系統(tǒng)是否符合用戶利益及指令遵循度的關(guān)鍵指標(biāo)上,Opus 4.8 的表現(xiàn)已與 Claude Mythos Preview 持平。
推出動(dòng)態(tài)工作流,賦能大規(guī)模代碼遷移
伴隨模型更新,Anthropic 推出了處于研究預(yù)覽階段的 " 動(dòng)態(tài)工作流 "(Dynamic Workflows)功能。該功能旨在讓 Claude 在 Claude Code 環(huán)境中承擔(dān)更復(fù)雜的任務(wù),能夠自主規(guī)劃工作路徑、在單次會(huì)話中運(yùn)行數(shù)百個(gè)并行子代理,并在向用戶交付結(jié)果前完成輸出驗(yàn)證。
Anthropic 舉例稱,搭載 Opus 4.8 的 Claude Code 現(xiàn)已能夠執(zhí)行涉及數(shù)十萬(wàn)行代碼的代碼庫(kù)規(guī)模遷移,從啟動(dòng)到合并全流程自動(dòng)化,并以現(xiàn)有測(cè)試套件作為基準(zhǔn)確保質(zhì)量。目前,動(dòng)態(tài)工作流功能僅面向企業(yè)版(Enterprise)、團(tuán)隊(duì)版(Team)和 Max 版的 Claude Code 用戶開放。
此次更新還引入了一項(xiàng)新的控制功能,允許用戶調(diào)整模型在處理任務(wù)時(shí)的 " 精力投入 " 程度。這一設(shè)置有助于用戶在響應(yīng)速度、推理深度和成本之間找到最佳平衡點(diǎn)。
Mythos 級(jí)模型即將全面開放
Anthropic 同時(shí)透露了新一代 AI 模型的進(jìn)展。被稱為 Mythos 級(jí)的模型目前正通過(guò) Project Glasswing 項(xiàng)目由少數(shù)機(jī)構(gòu)進(jìn)行測(cè)試,其智能水平據(jù)稱將超越 Opus 系列。一旦額外的網(wǎng)絡(luò)安全保障措施部署到位,該模型預(yù)計(jì)將在未來(lái)幾周內(nèi)向所有客戶開放。
" 我們?nèi)杂性S多工作要做,"Anthropic 表示," 我們正在開發(fā)并發(fā)布許多具備與 Opus 相同能力但成本更低的新模型。"
【來(lái)源:星途科訊】