电竞比分网-中国电竞赛事及体育赛事平台

關于ZAKER 合作
鈦媒體 12小時前

雪藏背后:Anthropic 的技術、商業(yè)與倫理困境

文 | 硅基星芒

一向自詡為 " 道德標桿 " 的 Anthropic,上周發(fā)布其最新模型 Claude Mythos Preview 后,罕見地宣布不向公眾開放,理由是該模型的網絡攻擊能力已構成 " 前所未有的網絡安全風險 "。

一個 AI 公司主動雪藏自己的產品,這本身就是一個信號。

本文想從四個角度來梳理這件事:

●模型能力的真實躍升

●技術架構的可能來源

●商業(yè)策略下的成本轉嫁

●以及互聯(lián)網底層規(guī)則的悄然瓦解。

最終我們看到,技術狂飆與商業(yè)反噬之間的張力,遠比表面看起來復雜。

01 AI 完全自主攻陷企業(yè)網絡

在大多數(shù)人的認知中,AI 還只是一個會寫代碼、做數(shù)學題的聊天機器人。

然而,英國人工智能安全研究所(AISI)近期發(fā)布的一份核心評測報告徹底重塑了人們對 AI 殺傷力的理解。

這份報告揭露了一個令人恐懼的事實:前沿大模型已經實現(xiàn)了從智能助手到數(shù)字 " 傭兵 " 的進化。

這場攻防演練的主角,正是 Anthropic 前幾天推出的最新模型Claude Mythos Preview。

相比 Claude Code 和 Opus,這款名為 Mythos 的模型最大的區(qū)別在于沒有公開發(fā)布。

原因竟然是 Anthropic 評估該模型的能力過強,一旦被濫用風險無法估量。

聽起來有些難以置信,但這并非單純的商業(yè)宣傳。

4 月 11 日,美國副總統(tǒng)和財政部部長召集了 Anthropic、xAI、Google、OpenAI、微軟等世界頂級 AI 公司的 CEO,專門對以 Mythos 為首的 AI 模型的安全性及網絡攻擊應對策略進行討論。

目前,Anthropic 僅僅向 Apple、Google、微軟、英偉達等少數(shù)企業(yè)定向開放了該模型,并重點評估防范黑客濫用的機制。

能夠引起美國政府的重點關注,這款模型宣傳的能力絕非浪得虛名。

在古希臘語中,Mythos 往往代指神話、故事等虛構敘事,代表這款模型的能力上限已經遠超人們的想象。

然而,真正支持 Mythos 達到如此水平的,是它在古希臘語中與這個詞對立的 Logos(理性思辨)上做到了極致。

為了測試 AI 的能力上限,AISI 構建了一個名為 "The Last Ones(TLO)" 的高仿真企業(yè)網絡靶場。

這與此前網絡安全技術人員之間進行技術競技的 " 奪旗賽 " 有所不同,TLO 是一個包含 32 步的企業(yè)網絡攻擊場景,目標則是從受保護的內部數(shù)據(jù)庫中竊取敏感數(shù)據(jù)。

換句話說,這是一場包含偵察、憑證竊取、NTLM 中繼攻擊直到最終數(shù)據(jù)竊取的 32 步超長周期滲透測試。

AI 智能體自主向攻擊目標推進能夠完成的步數(shù)越多,性能就越強。

對于這個測試,即使是人類頂級安全專家,完成一整套流程通常也需要耗費 14-20 小時的連續(xù)高強度工作。

但在長達 18 個月的縱向跟蹤中,AISI 看到了一條令人不寒而栗的能力進化曲線:

2024 年,獨領風騷的 GPT-4o 在這個靶場測試中平均只能完成 1.7 步,證明它對復雜的網絡拓撲結構和密碼學瓶頸束手無策,迅速陷入了停滯。

2026 年 2 月,編程之王 Claude Opus 4.6 出場,在 1 億 token 的推理算力預算下,一舉拿下 22 步的高光成績。

然而,僅僅兩個月過去,Mythos 就大幅刷新了這個成績,它竟然在 10 次獨立測試中有 3 次完美通關了 32 個步驟,首次實現(xiàn)了對企業(yè)網絡從 0 開始的完全自主接管。

在對 Mythos 能力發(fā)生跨越式進步的驚嘆之余,它也揭示了現(xiàn)階段 AI 演進方向的底層邏輯:

規(guī)?;蓱摷由弦粋€定語 "Inference",模型能力提升不能僅僅依靠預訓練階段的知識灌輸,必須通過近乎不計成本的 token 消耗,在推理階段進行反復的試錯、反思和糾正。

另一個值得關注的重點突破在于,在網絡安全領域,算力已經是 Mythos 唯一的限制。

只要給予足夠的 token 預算,它就能在漫長的攻擊序列中鏈式結合異構能力。

在工業(yè)控制系統(tǒng)(ICS)靶場測試 "Cooling Tower" 中,甚至有多個模型跳出了人類預設的 Web 提權常規(guī)路徑,直接憑借對未知協(xié)議網絡流量的暴力嗅探和模糊測試,硬生生砸開了一臺物理設備的控制通道。

以 Mythos 為首的前沿模型,不僅對全球網絡安全防御體系造成了降維打擊,也證明了它們在復雜物理映射世界中已經具備極強的自主執(zhí)行力。

這就意味著,幾個月后,你的電腦、你的電動汽車甚至是你的智能馬桶都可能不再安全。

02 異常的跑分與 " 幽靈架構 "

Mythos 帶來的這種詭異的推理能力躍升,顯然無法僅僅用參數(shù)規(guī)模和顯卡的堆砌來解釋。

然而,能使用 Mythos 模型的公司都屈指可數(shù),從代碼層面上解構技術特點自然是無稽之談。

不過,就在 Anthropic 對其模型架構諱莫如深的同時,一份異常的基準測試成績卻引起了技術社區(qū)關于 " 幽靈架構 " 的熱烈討論。

目前用戶能看到的關于 Mythos 的相關信息,就只有 Anthropic 官方發(fā)布的系統(tǒng)卡片。

敏銳的研究人員在其中發(fā)現(xiàn)了一個不太尋常的數(shù)據(jù)異常:在考察模型應對復雜圖結構廣度優(yōu)先搜索能力的 GraphWalks BFS 測試中,Mythos 的得分遠超對手達到 80.0%,而兩個月前發(fā)布的 Opus 4.6 只有 38.7%,GPT-5.4 更是只有 21.4%。

目前 AI 行業(yè)模型性能層面上的提升速度已經顯著放緩,這種在單一純邏輯推力維度上的斷崖式領先,絕非標準 Transformer 架構通過常規(guī)思維鏈輸出大量文本所能達到的效果。

前 Meta、現(xiàn) OpenAI 的工程師 Chris Hayduk 直接捅破了這層窗戶紙,并將矛頭指向了一種創(chuàng)新的底層架構設計:循環(huán)語言模型(Looped Language Models)。

這個名字,不可避免地讓人聯(lián)想到字節(jié)跳動 Seed 團隊在去年 10 月發(fā)布的一篇名為《Scaling Latent Reasoning via Looped Language Models》的論文。

字節(jié)的研究團隊提到了一個開創(chuàng)性的核心思想:徹底拋棄在外部生成大量文字讓模型思考的模式,轉而讓輸入序列在同一組 Transformer 層中反復進行內部的多輪迭代計算,在模型的 " 黑盒 " 中完成深度的邏輯推演。

而圖搜索,正是這種架構在理論上的絕對舒適區(qū)。

令人疑惑之處還不止兩種架構上的相似。

在 SWE-Bench 測試中,Mythos 消耗的 token 生成數(shù)量只有前代旗艦模型 Opus 4.6 的五分之一,但得出最終答案的推理耗時反而更長。

按照傳統(tǒng)的計算邏輯,輸出越少,計算速度理應越快。

不過,若是像循環(huán)語言模型一樣,把海量的計算成本隱藏在不輸出 token 的內部循環(huán)之中,這一看似矛盾的現(xiàn)象就能完美地迎刃而解。

盡管模型性能存在顯著差距,但 Anthropic 面對外界質疑集體噤聲仍然略顯欲蓋彌彰。

當然,只要模型不被公開發(fā)布,任何推測都不可能被證實。

不過我們仍然有理由認為,象征著美國硅谷最高技術結晶的下一代頂級模型,核心架構的設計靈感大概率源自中國團隊在開源社區(qū)毫無保留的學術分享。

盡管國內外 AI 大模型的權力格局已經基本確定,但這種隱秘的技術路線借用早已是行業(yè)中不言而喻的 " 秘密 "。

值此之際,試問國際頂尖 AI 企業(yè)又有什么立場聯(lián)手抵制國內 AI 企業(yè)的蒸餾行為呢?

03 悄無聲息被砍掉的緩存時間

Anthropic 的奇葩操作還遠遠不止于此。

在 Mythos 體現(xiàn)出了神明一般的能力的同時,支撐其能力的算力成本還是一筆糊涂賬。

然而,買單的人卻已經確定,那就是數(shù)以萬計的無辜開發(fā)者。

近期,一位名為 seanGSISG 的開發(fā)者在 GitHub 上發(fā)布了一份數(shù)據(jù)分析報告,用接近 12 萬次 Claude Code API 調用日志將 Anthropic 的暗箱操作公開于眾:

從 3 月 6 日至 3 月 8 日,Anthropic 在沒發(fā)布任何公告、更新日志和警告的情況下,悄無聲息地將 API 提示詞緩存的默認存活時間(TTL)從原本的 1 小時砍到了 5 分鐘。

時間的驟降,帶來的是成本的飆升。

從 2 月 1 日到 3 月 5 日,系統(tǒng)穩(wěn)定運行在 1 小時緩存的檔位,而當時的緩存資源浪費率只有 1.1%。

然而在 3 月 6 日之后,5 分鐘級別的緩存刷新簡直就像是一只吸血鬼,瞬間掏空了開發(fā)者的錢包。

僅僅是 Sonnet 模型的調用,就直接導致了用戶的隱性使用成本被硬生生提高了 17%,3 月的資金浪費率也隨之暴漲到 26%

這種簡單粗暴的數(shù)學邏輯的核心驅動力,毫無疑問是背后的商業(yè)貪婪。

TTL 變短意味著龐大的上下文背景信息每隔 5 分鐘就會失效,系統(tǒng)就必須不斷重新寫入并創(chuàng)建緩存(KV Cache)。

而這么做的原因,在每一款 AI 產品的價格表上都體現(xiàn)得淋漓盡致:緩存命中與未命中時的 token 輸入價格簡直是天壤地別,后者比前者貴十倍都是常見定價。

最倒霉的反而是那些為了追求機制生產力而購買 Pro Max 訂閱服務、付費意愿最強的用戶,他們付款最多,使用最頻繁,額度耗盡也最快。

這種容易被忽視的暗箱操作,反應的仍然是頂尖 AI 企業(yè)面對長上下文計算壓力時不得不采取的商業(yè)妥協(xié)。

算力瓶頸從未消失,現(xiàn)階段也沒有人能給出任何解決方案。

聚光燈下 Mythos 展現(xiàn)出了迄今為止人工智能的最高水平,而陰暗的角落中 Anthropic 卻要克扣開發(fā)者的每一分鐘緩存。

以前市場總會質疑大模型的運行是一筆虧本買賣,而如今的狀況已經完全相反。

從上個月國產模型紛紛宣布漲價來看,算力問題短期內不可能被根本性解決,而 Anthropic 的這種行為勢必會蔓延到全球 AI 企業(yè)。

04 傳統(tǒng)互聯(lián)網契約的徹底毀滅

如果把視線進一步抬高,從圍觀的開發(fā)者生態(tài)轉移到整個互聯(lián)網的宏觀倫理層面,就會發(fā)現(xiàn) Anthropic 這家自詡為 AI 道德標桿的巨頭正在榨干互聯(lián)網上全部的剩余價值。

Cloudflare 這家為全球互聯(lián)網提供底層基礎設施服務的公司,恐怕全球的網友們都不會陌生。

而 2026 年 4 月初 Cloudflare 發(fā)布的一份最新數(shù)據(jù),無情地揭示了 Anthropic 主導的一場數(shù)據(jù)榨取的真相。

傳統(tǒng)的互聯(lián)網生態(tài)中,網站需要流量才能生存,流量(點擊量)就是獲取信息的成本。

但自打 AI 出現(xiàn)以后,不少網站的信息失去了這種價值。

Cloudflare 通過追蹤 AI 的爬蟲抓取網站內容的次數(shù),與這些平臺為原創(chuàng)網站帶來的流量回流進行對比,并定義了一個叫做 " 抓取回流比(crawl-to-refer ratio)" 的指標,以此衡量 AI 的行為給網站造成的影響。

而在這份榜單上,始終把 " 人類利益和負責任 AI" 掛在嘴邊的 Anthropic,憑借著8800:1的刺眼數(shù)據(jù)穩(wěn)居倒數(shù)第一,碾壓了同行競品。

OpenAI 的抓取回流比是 993.3:1,還不到 Anthropic 的八分之一。

簡單來說,Anthropic AI 創(chuàng)建的爬蟲在對互聯(lián)網網頁進行 8000 次的抓取后,只能給原創(chuàng)網站帶來 1 次點擊流量的回流。

在 AI 出現(xiàn)前的十幾年,互聯(lián)網的生態(tài)運轉一直建立在一個心照不宣的隱形契約之上:

創(chuàng)作者允許搜索引擎免費爬取和索引自己的原創(chuàng)心血,作為交換,他們將獲得可用于變現(xiàn)的真實用戶流量。

然而,貪婪的生成式 AI 不僅破壞了這份契約,還試圖從中榨取盡可能多的價值。

它們在訓練階段將互聯(lián)網上僅存的人類智慧結晶嚼碎并消化,在推理階段把知識以最終答案的形式喂給用戶,徹底掐斷了用戶點擊溯源的路徑。

而這些極其高頻的爬蟲活動,從未將網站擁有者的服務器宕機風險和帶寬成本納入考量。

Anthropic 引領的這場技術狂歡,帶來的卻是建立在技術強權上的生態(tài)環(huán)境毀滅。

但這種極具割裂感與諷刺的事實,在商業(yè)利益面前不僅不會被抵制,反而會被全球 AI 企業(yè)所效仿。

或許,在機器變得全知全能之前,人類數(shù)字文明已經淪為一片毫無生機廢墟。

最新評論

沒有更多評論了

覺得文章不錯,微信掃描分享好友

掃碼分享

熱門推薦

查看更多內容

企業(yè)資訊

查看更多內容