电竞比分网-中国电竞赛事及体育赛事平台

關(guān)于ZAKER 合作

中國(guó)首次!阿里 HappyHorse-1.0 登頂 LM Arena 視頻編輯榜

【CNMO 科技消息】4 月 15 日,權(quán)威 AI 模型評(píng)測(cè)平臺(tái) LM Arena 公布最新 Video Edit(視頻編輯)方向排行榜。阿里巴巴 ATH 事業(yè)群旗下模型HappyHorse-1.0 以 1299 分的 Elo 評(píng)分位列榜首,超越 xAI 的 Grok Imagine Video(1257 分),成為該榜單該方向首個(gè)由中國(guó)團(tuán)隊(duì)獲得的第一。

阿里巴巴

LM Arena 是全球 AI 社區(qū)公認(rèn)的權(quán)威盲測(cè)評(píng)估平臺(tái),采用匿名對(duì)比投票機(jī)制,由用戶(hù)在不知道模型歸屬的前提下進(jìn)行偏好投票,并通過(guò) Elo 評(píng)分體系生成排名。此次上榜的 HappyHorse-1.0 隸屬阿里巴巴 ATH(Alibaba Token Hub)事業(yè)群,組織代號(hào)為 Alibaba-ATH。

HappyHorse

據(jù)悉,HappyHorse-1.0 采用150 億參數(shù)的 40 層單流自注意力 Transformer 架構(gòu),實(shí)現(xiàn)了原生音視頻同步生成。與主流視頻生成模型 " 先出無(wú)聲視頻、后配樂(lè)對(duì)口型 " 的多工序流程不同,該模型將視頻和音頻的生成合并進(jìn)一個(gè)流程,一次前向推理直接輸出帶聲音的成片,無(wú)需任何后期拼接。同時(shí),模型原生支持英語(yǔ)、普通話(huà)、粵語(yǔ)、日語(yǔ)、韓語(yǔ)、德語(yǔ)和法語(yǔ)七種語(yǔ)言的唇形同步。

CNMO 注意到,這并非 HappyHorse 首次在權(quán)威盲測(cè)中登頂。此前,HappyHorse 系列模型已在 Artificial Analysis 的 Video Arena 榜單中以匿名身份登頂文生視頻和圖生視頻雙賽道,超越字節(jié)跳動(dòng) Seedance 2.0、快手可靈 3.0、Google Veo 3 Fast 等國(guó)內(nèi)外頭部模型。在該平臺(tái)的文本轉(zhuǎn)視頻(無(wú)音頻)賽道中,HappyHorse 跑出1409 分的高分,刷新該榜歷史紀(jì)錄,領(lǐng)先第二名字節(jié)跳動(dòng) Seedance 2.0 約 110 分;在圖像轉(zhuǎn)視頻(無(wú)音頻)賽道中,領(lǐng)先第二名 48 分。

相關(guān)標(biāo)簽

相關(guān)閱讀

最新評(píng)論

沒(méi)有更多評(píng)論了

覺(jué)得文章不錯(cuò),微信掃描分享好友

掃碼分享

熱門(mén)推薦

查看更多內(nèi)容

企業(yè)資訊

查看更多內(nèi)容