电竞比分网-中国电竞赛事及体育赛事平台

關(guān)于ZAKER Skills 合作
鈦媒體 30分鐘前

700 億融資趕緊到位吧,DeepSeek 開始限制重生、修改次數(shù)了

文 | 字母 AI

5 月 29 日下午,不少網(wǎng)友發(fā)現(xiàn),DeepSeek 重新生成、修改有次數(shù)限制了。

連續(xù)修改或重新生成幾次后,頁面會(huì)提示達(dá)到上限。有網(wǎng)友反饋,在普通對(duì)話中,重新生成 3 到 6 次后就會(huì)達(dá)到上限;而在專家模式下,可能只有 3 次機(jī)會(huì)。修改輸入次數(shù)上限一般是 6 次。

目前 DeepSeek 還沒有發(fā)布正式公告,也沒有公開固定配額表,但這件事已經(jīng)在社群引發(fā)激烈討論——畢竟 DeepSeek 有大量的忠實(shí)用戶,包括我在內(nèi),平時(shí)偶爾遇到服務(wù)器繁忙、頁面崩一下,大家還能體諒,但怎么說也不能一聲不吭地加限制了吧,讓人很慌啊。

API 倒是沒受什么影響,所以大概率還是基礎(chǔ)設(shè)施的問題,熟悉的配方。

算力告急下的臨時(shí)限流?

對(duì)于這次限制,小紅書上的 " 半官方賬號(hào) " 白墻表示:別慌,這是暫時(shí)的。

按照它的說法," 修改消息 " 和 " 重新生成 " 突然被限制,并不是 DeepSeek 在做所謂 " 負(fù)優(yōu)化 ",只是算力壓力太大之后采取的臨時(shí)措施。

因?yàn)?DeepSeek 這段時(shí)間用戶量增長(zhǎng)很快,尤其是從 5 月 29 日下午開始,App 端請(qǐng)求壓力明顯。為了優(yōu)先保證最基礎(chǔ)的文字對(duì)話還能正常使用,團(tuán)隊(duì)只能先對(duì) " 修改消息 " 和 " 重新生成 " 這類高頻操作做限制。

雖然在用戶界面上," 重新生成 " 只是點(diǎn)一下按鈕," 修改消息 " 也只是改一下原來的問題。但對(duì)服務(wù)器來說,這兩件事都不是簡(jiǎn)單刷新,而是一次新的推理請(qǐng)求。用戶每點(diǎn)一次重新生成,模型就要重新處理上下文、生成答案。修改消息也是一樣,只要原問題變了,模型就需要基于新的輸入再回答一遍。

所以,當(dāng)大量用戶同時(shí)反復(fù)點(diǎn)擊,把 " 重新生成 " 當(dāng)成無限抽卡按鈕時(shí),這部分請(qǐng)求就會(huì)變成很重的服務(wù)器壓力。

這件事可以和 DeepSeek 近期的一些變化放在一起看。比如專家模式文件上傳下架、智能搜索功能關(guān)閉,以及不時(shí)出現(xiàn)的 " 服務(wù)器繁忙 ",背后的原因其實(shí)都是算力資源緊張,整體服務(wù)壓力已經(jīng)高到需要做取舍。

DeepSeek 太好用了,底層基建要跟上啊。

對(duì)于 " 修改消息 " 或 " 重新生成 " 達(dá)到上限的情況,白墻給出的建議是,不要連續(xù)快速點(diǎn)擊,可以先停下來,等 15 到 30 分鐘后再試。按照該賬號(hào)的說法,多數(shù)情況下限制會(huì)在等待后自動(dòng)恢復(fù);如果反復(fù)快速點(diǎn)擊,反而可能被系統(tǒng)識(shí)別為異常高頻請(qǐng)求,導(dǎo)致限制時(shí)間變長(zhǎng)。

白墻同時(shí)還提到,華為昇騰超節(jié)點(diǎn)的新卡正在部署中,預(yù)計(jì)下半年上線,屆時(shí)算力會(huì)大幅擴(kuò)容,這些臨時(shí)限制大概率會(huì)取消。

不過,DeepSeek 官方暫時(shí)還沒就此事發(fā)出公告。包括限制次數(shù)、恢復(fù)時(shí)間,以及下半年算力擴(kuò)容后的具體變化,都還需要等待官方進(jìn)一步確認(rèn)。

DeepSeek 不是孤例

其實(shí) DeepSeek 并不是第一家這么做的 AI 公司。

大模型產(chǎn)品在算力緊張、用戶暴漲或者高峰期壓力過大的時(shí)候,常見做法就是限流、降級(jí)、排隊(duì),或者把一些高消耗功能單獨(dú)拿出來限制。

ChatGPT 就一直有消息上限,即使是付費(fèi)用戶,在高需求時(shí)期也可能遇到使用次數(shù)限制。免費(fèi)用戶達(dá)到高級(jí)模型額度后,也會(huì)被切換到更輕量的模型繼續(xù)使用。

可以理解為一種 " 服務(wù)降級(jí) ",不是不讓用,只是不能讓所有人都無限使用最貴、最占資源的能力。

Claude 也類似,Anthropic 會(huì)給不同用戶設(shè)置使用預(yù)算,Claude Code、API 這類高頻場(chǎng)景也會(huì)根據(jù)容量變化調(diào)整上限。算力寬裕的時(shí)候,額度可以提高;請(qǐng)求壓力上來的時(shí)候,限制就會(huì)更明顯。

5 月 6 日,Anthropic 還專門發(fā)文說,隨著新的算力合作和容量增加,它提高了 Claude Code 和 Claude API 的使用上限。反過來也說明,使用上限和算力容量是直接掛鉤的,算力緊張時(shí)就會(huì)收緊,算力擴(kuò)容后才會(huì)放開。

不過 Anthropic 現(xiàn)在對(duì)不同訂閱的額度都設(shè)置了更細(xì)的使用限制,Claude Code 這類高消耗場(chǎng)景也越來越接近 token 計(jì)量收費(fèi)的邏輯。

圖像和視頻生成產(chǎn)品就更典型了,Sora、Gemini 的圖像生成功能、以及其他 AI 視頻工具,在需求激增時(shí)都出現(xiàn)過生成次數(shù)收緊、排隊(duì)時(shí)間變長(zhǎng)、免費(fèi)額度減少的情況。

可以說," 每一次推理都有成本 " 已經(jīng)成為 AI 產(chǎn)品難以避開的現(xiàn)實(shí)。

前段時(shí)間,豆包收費(fèi)就引發(fā)過一輪討論。" 豆包,貴又難用 " 一度沖上微博熱搜,它和 DeepSeek 這次限制功能不同,但用戶反應(yīng)背后的邏輯是相通的:大家習(xí)慣了 AI 產(chǎn)品便宜、隨便用,一旦平臺(tái)開始收費(fèi),或者開始限制某些功能,用戶情緒很容易反彈。

對(duì) AI 公司來說,基礎(chǔ)能力免費(fèi),復(fù)雜能力開始收費(fèi),高成本功能設(shè)置額度,高峰期再做臨時(shí)限流,其實(shí)是很常見的做法。

DeepSeek 限制 " 重新生成 " 和 " 修改消息 " 的次數(shù),放在整個(gè) AI 行業(yè)里看并不算特殊。它限制的不是聊天入口或者模型本身,只是那些容易被用戶高頻點(diǎn)擊、但每點(diǎn)一次都會(huì)重新消耗推理資源的操作。

因?yàn)榛A(chǔ)對(duì)話必須盡量保住,這是用戶還能不能用產(chǎn)品的底線;但重新生成、反復(fù)修改、文件上傳、聯(lián)網(wǎng)搜索、長(zhǎng)上下文、多模態(tài)生成這些功能,都更容易在壓力大時(shí)被限流或降級(jí)。

我覺得,這次爭(zhēng)議的重點(diǎn),其實(shí)不是 " 限多少 " 而是 " 怎么限 "。

如果官方能早點(diǎn)說明,這是臨時(shí)限流、多久恢復(fù)、哪些操作受影響,用戶大概率會(huì)更容易接受。但在沒有公告的情況下突然不能用了,大家當(dāng)然會(huì)第一時(shí)間懷疑是不是功能在縮水、是不是以后要收費(fèi)。

當(dāng) AI 產(chǎn)品從嘗鮮工具變成日常工具,用戶會(huì)越來越在意穩(wěn)定性和透明度,限制本身可以理解,但最好不要讓用戶在彈窗里才第一次知道。

DeepSeek 要知道,使用次數(shù)激增到需要被限額,同時(shí)也意味著,有很多用戶正在等著你。

哪怕只是給個(gè)準(zhǔn)信。

相關(guān)標(biāo)簽

相關(guān)閱讀

最新評(píng)論

沒有更多評(píng)論了

覺得文章不錯(cuò),微信掃描分享好友

掃碼分享

熱門推薦

查看更多內(nèi)容

企業(yè)資訊

查看更多內(nèi)容