电竞比分网-中国电竞赛事及体育赛事平台

關(guān)于ZAKER Skills 合作
星途科訊 昨天

Anthropic 發(fā)布 Claude Opus 4.8:代碼缺陷漏報(bào)率狂降四倍

Anthropic 正式發(fā)布 Claude Opus 4.8 模型,并公布了將其最高階 Mythos 級(jí)模型向更廣泛用戶開放的路線圖。該公司預(yù)計(jì),將在未來(lái)幾周內(nèi)向所有客戶提供這些頂級(jí)模型。

Claude Opus 4.8 現(xiàn)已全面開放,定價(jià)策略與此前的 Opus 4.7 保持一致。Anthropic 重點(diǎn)強(qiáng)調(diào)了新模型在 " 誠(chéng)實(shí)性 " 方面的顯著改進(jìn):在信息不足時(shí),Opus 4.8 更傾向于承認(rèn)知識(shí)盲區(qū),而非做出缺乏依據(jù)的斷言。

據(jù)官方披露,早期測(cè)試反饋顯示,Opus 4.8 在執(zhí)行代理任務(wù)時(shí)表現(xiàn)出更高的可靠性和更敏銳的判斷力。評(píng)估數(shù)據(jù)指出,該模型在生成代碼時(shí),缺陷漏報(bào)率較前代降低了約四倍。此外,測(cè)試中的欺騙行為和偏差率也有所下降,在衡量系統(tǒng)是否符合用戶利益及指令遵循度的關(guān)鍵指標(biāo)上,Opus 4.8 的表現(xiàn)已與 Claude Mythos Preview 持平。

推出動(dòng)態(tài)工作流,賦能大規(guī)模代碼遷移

伴隨模型更新,Anthropic 推出了處于研究預(yù)覽階段的 " 動(dòng)態(tài)工作流 "(Dynamic Workflows)功能。該功能旨在讓 Claude 在 Claude Code 環(huán)境中承擔(dān)更復(fù)雜的任務(wù),能夠自主規(guī)劃工作路徑、在單次會(huì)話中運(yùn)行數(shù)百個(gè)并行子代理,并在向用戶交付結(jié)果前完成輸出驗(yàn)證。

Anthropic 舉例稱,搭載 Opus 4.8 的 Claude Code 現(xiàn)已能夠執(zhí)行涉及數(shù)十萬(wàn)行代碼的代碼庫(kù)規(guī)模遷移,從啟動(dòng)到合并全流程自動(dòng)化,并以現(xiàn)有測(cè)試套件作為基準(zhǔn)確保質(zhì)量。目前,動(dòng)態(tài)工作流功能僅面向企業(yè)版(Enterprise)、團(tuán)隊(duì)版(Team)和 Max 版的 Claude Code 用戶開放。

此次更新還引入了一項(xiàng)新的控制功能,允許用戶調(diào)整模型在處理任務(wù)時(shí)的 " 精力投入 " 程度。這一設(shè)置有助于用戶在響應(yīng)速度、推理深度和成本之間找到最佳平衡點(diǎn)。

Mythos 級(jí)模型即將全面開放

Anthropic 同時(shí)透露了新一代 AI 模型的進(jìn)展。被稱為 Mythos 級(jí)的模型目前正通過(guò) Project Glasswing 項(xiàng)目由少數(shù)機(jī)構(gòu)進(jìn)行測(cè)試,其智能水平據(jù)稱將超越 Opus 系列。一旦額外的網(wǎng)絡(luò)安全保障措施部署到位,該模型預(yù)計(jì)將在未來(lái)幾周內(nèi)向所有客戶開放。

" 我們?nèi)杂性S多工作要做,"Anthropic 表示," 我們正在開發(fā)并發(fā)布許多具備與 Opus 相同能力但成本更低的新模型。"

【來(lái)源:星途科訊】

相關(guān)標(biāo)簽

相關(guān)閱讀

最新評(píng)論

沒(méi)有更多評(píng)論了
星途科訊

星途科訊

解碼海外,科技新知

訂閱

覺(jué)得文章不錯(cuò),微信掃描分享好友

掃碼分享

企業(yè)資訊

查看更多內(nèi)容