电竞比分网-中国电竞赛事及体育赛事平台

量子位 20小時(shí)前

阿里 Qwen 上新多模態(tài)旗艦！11 小時(shí)自動(dòng)研發(fā) App，狂寫 10000+ 行代碼 1000+ 次調(diào)用

帶多模態(tài)的 Agent 模型，真就了不起。

一句話，十幾分鐘，仿寫一個(gè)網(wǎng)頁版 MacOS 界面。

每個(gè)應(yīng)用都能點(diǎn)進(jìn)去，終端輸入命令還能返回結(jié)果我是最服氣的。

這就是阿里上新的 Qwen-3.7 Plus，多模態(tài)交互式混合 Agent。

Qwen3.7-Plus 把視覺和語言能力放進(jìn)同一個(gè)底座，同時(shí)保留代碼、工具使用。這些智能體能力。

它能感知現(xiàn)實(shí)場景，讀屏并操作 GUI，從視覺參考里寫代碼，端到端導(dǎo)航 App，還能結(jié)合網(wǎng)頁知識回答視覺問題。

以前很多模型擅長單點(diǎn)能力，看圖歸看圖，寫代碼歸寫代碼，瀏覽網(wǎng)頁歸瀏覽網(wǎng)頁。

Qwen3.7-Plus 想把它們放進(jìn)同一個(gè)循環(huán)。

這也是 "Hybrid"（混合）的含義。

官方展示里，最突出的是一個(gè)長程 App 研發(fā)任務(wù)。

團(tuán)隊(duì)基于 Qwen3.7 構(gòu)建的 Hybrid-Agent 系統(tǒng)，連續(xù)穩(wěn)定運(yùn)行超過 11 小時(shí)，自動(dòng)完成一個(gè)英語詞匯學(xué)習(xí) App 的完整研發(fā)周期。

覆蓋需求文檔生成、自動(dòng)編碼、安裝部署、測試用例創(chuàng)建、GUI 自動(dòng)化測試、多場景并行測試、產(chǎn)品文檔更新，以及自主版本演進(jìn)。

10000+ 行代碼，1000+ 次 Agent 調(diào)用。

另一個(gè)桌面應(yīng)用開發(fā)案例是復(fù)刻了原生 macOS Stocks App。

智能體先和原生應(yīng)用交互，理解 UI 布局和功能細(xì)節(jié)，再生成 SwiftUI 源碼，接入真實(shí)行情 API，自動(dòng)編譯并啟動(dòng)復(fù)刻應(yīng)用。

它還做了 10 項(xiàng)功能驗(yàn)證，包括實(shí)時(shí)行情加載、股票選擇和切換、多周期視圖切換、搜索過濾、詳細(xì)統(tǒng)計(jì)面板展示等。

這 10 項(xiàng)都通過了。

Qwen3.7-Plus 的基準(zhǔn)測試環(huán)境配置有詳細(xì)披露：

Terminal Bench 2.0 使用 Harbor/Terminus-2 harness，5 小時(shí)超時(shí)，12 核 CPU/24GB 內(nèi)存，溫度 1.0，最大 token 數(shù) 80K，上下文 256K，取 5 次運(yùn)行均值，每輪開頭預(yù)置一個(gè) think token 讓模型自行決定是否啟動(dòng)深度思考；

Kernel Bench L3 每個(gè)測試樣本在獨(dú)立 Docker 容器中運(yùn)行，配備一塊 H100 80GB GPU，限制 500 次工具調(diào)用，連續(xù) 100 輪無改進(jìn)則提前停止，并使用 GPT-5.4 檢測潛在的作弊行為。

結(jié)果如何？

代碼任務(wù)，各家模型表現(xiàn)已經(jīng)非常接近，只有長程代碼任務(wù)還能拉開一點(diǎn)差距。

通用智能體任務(wù)，Qwen 3.7 Plus 基本也在第一梯隊(duì)。

到了多模態(tài)任務(wù)，就是 Qwen 3.7 Plus 的強(qiáng)項(xiàng)了。

Qwen3.7-Plus 提供 API 調(diào)用，支持文本和圖像 / 視頻混合輸入，并提供 "preserve_thinking" 功能，

在多輪對話的消息中保留每一輪的思考內(nèi)容，官方推薦在智能體任務(wù)中開啟此功能。

模型兼容 OpenAI 規(guī)范的 chat completions 和 responses API。

在跨框架泛化方面，Qwen3.7-Plus 在 Claude Code、OpenClaw、Qwen Code 等不同 Agent 框架中均能穩(wěn)定運(yùn)行，無需為特定框架做適配。

不過還是有大量開發(fā)者希望能繼續(xù)像 Qwen 之前的模型一樣開放權(quán)重，在本地部署。

— 歡迎 AI 產(chǎn)品從業(yè)者共建 —

「AI 產(chǎn)品知識庫」是量子位智庫基于長期產(chǎn)品庫追蹤和用戶行為數(shù)據(jù)推出的飛書知識庫，旨在成為 AI 行業(yè)從業(yè)者、投資者、研究者的核心信息樞紐與決策支持平臺。

一鍵關(guān)注點(diǎn)亮星標(biāo)

科技前沿進(jìn)展每日見

宙世代

ZAKER旗下Web3.0元宇宙平臺

一起剪

ZAKER旗下免費(fèi)視頻剪輯工具

相關(guān)標(biāo)簽

ai 股票作弊

199元的“AI功能機(jī)”和900億市值，諾基亞的AI雙重?cái)⑹?/h2>
鈦媒體 10小時(shí)前

企業(yè)資訊

查看更多內(nèi)容

Blockchain News

电竞比分网-中国电竞赛事及体育赛事平台

宙世代元宇宙

元宇宙黨建解決方案

元宇宙文旅解決方案

元宇宙展廳解決方案

元宇宙行業(yè)峰會解決方案

元宇宙營銷解決方案

元宇宙會展解決方案

元宇宙演藝節(jié)目解決方案

元宇宙博物館解決方案

元宇宙圖書館解決方案

元宇宙校園解決方案

元宇宙企業(yè)展廳解決方案

元宇宙藝術(shù)展解決方案

元宇宙電商解決方案

融媒體解決方案

ZAKER智慧云

媒體解決方案

黨建解決方案

公檢法解決方案

智慧交通解決方案

高校解決方案

AI視頻

AI視頻剪輯

視頻定制服務(wù)

AI智能客服

我的訂閱

阿里 Qwen 上新多模態(tài)旗艦！11 小時(shí)自動(dòng)研發(fā) App，狂寫 10000+ 行代碼 1000+ 次調(diào)用

宙世代

一起剪

相關(guān)閱讀

美國AI軍備競賽遭遇現(xiàn)實(shí)瓶頸：6700億美元投入背后，數(shù)據(jù)中心難落地

又一批蘋果老設(shè)備要被淘汰！iPhone 11、iPad 8等無緣升級iOS/iPadOS 27

硬剛蘋果！華為Mate 90系列、新三折疊9月齊發(fā)：首發(fā)麒麟9050 Pro

邁入65mm大畫幅時(shí)代！索尼宣布研發(fā)RIALTO 65傳感器 面積為全畫幅2.2倍

AI需求引爆“芯片通脹” 摩根士丹利：沖擊正蔓延至整個(gè)經(jīng)濟(jì)

關(guān)鍵構(gòu)件量產(chǎn)落地！國產(chǎn)火箭貯箱箱底投產(chǎn) 助力商業(yè)航天提質(zhì)降本

智能體裝進(jìn)PC！中興、騰訊將合作推出原生Work Buddy的AI云電腦

AI敘事掀騰訊股價(jià)過山車，市值仍超4萬億

豆包回應(yīng)“收費(fèi)”

怎么哈根達(dá)斯中國也要賣了？

199元的“AI功能機(jī)”和900億市值，諾基亞的AI雙重?cái)⑹?/h2> 鈦媒體 10小時(shí)前

優(yōu)步人力部門裁員近四分之一，CEO稱“此番調(diào)整勢在必行”

谷歌將股權(quán)融資規(guī)模上調(diào)至847.5億美元

星塵智能B輪融資超10億元，繩驅(qū)技術(shù)路線撐起百億估值

AI芯片扎堆，寒武紀(jì)還能成中國版“英偉達(dá)”嗎？

最新評論

量子位

熱門推薦

企業(yè)資訊

阿里 Qwen 上新多模態(tài)旗艦！11 小時(shí)自動(dòng)研發(fā) App，狂寫 10000+ 行代碼 1000+ 次調(diào)用

又一批蘋果老設(shè)備要被淘汰！iPhone 11、iPad 8等無緣升級iOS/iPadOS 27

硬剛蘋果！華為Mate 90系列、新三折疊9月齊發(fā)：首發(fā)麒麟9050 Pro

邁入65mm大畫幅時(shí)代！索尼宣布研發(fā)RIALTO 65傳感器面積為全畫幅2.2倍

智能體裝進(jìn)PC！中興、騰訊將合作推出原生Work Buddy的AI云電腦

AI敘事掀騰訊股價(jià)過山車，市值仍超4萬億

怎么哈根達(dá)斯中國也要賣了？

199元的“AI功能機(jī)”和900億市值，諾基亞的AI雙重?cái)⑹?/h2>
鈦媒體 10小時(shí)前

優(yōu)步人力部門裁員近四分之一，CEO稱“此番調(diào)整勢在必行”

星塵智能B輪融資超10億元，繩驅(qū)技術(shù)路線撐起百億估值

AI芯片扎堆，寒武紀(jì)還能成中國版“英偉達(dá)”嗎？