2024 年初,OpenAI 發(fā)布 Sora 時(shí),影視行業(yè)經(jīng)歷了一場(chǎng)集體性的恐慌,市場(chǎng)普遍預(yù)測(cè),好萊塢的攝影棚將被算力中心取代,攝像機(jī)搞不好要成為歷史文物。
一年過去了,這種恐慌被現(xiàn)實(shí)的尷尬稀釋,創(chuàng)作者們發(fā)現(xiàn),硬盤里塞滿了驚艷的幾秒鐘片段,卻拼湊不出一個(gè)連貫的三分鐘故事。
核心矛盾在于,商業(yè)視頻創(chuàng)作需要的是連貫內(nèi)容,而當(dāng)前的 AI 生成具有高度的隨機(jī)性。你在第一個(gè)鏡頭里生成了一個(gè)穿白衣的女孩,在第二個(gè)鏡頭里,她可能變成穿紅衣,甚至換了一張臉。
場(chǎng)景的光影、道具的細(xì)節(jié),在不同的生成批次中難以對(duì)齊。
這種 " 抽盲盒 " 式的體驗(yàn),導(dǎo)致 AI 視頻技術(shù)長(zhǎng)期停留在 " 演示 DEMO" 階段,難以真正進(jìn)入影視工業(yè)的生產(chǎn)流程。
對(duì)于商業(yè)公司而言,無法穩(wěn)定交付的技術(shù),只是玩具,不是工具。
行業(yè)內(nèi)曾流傳一種觀點(diǎn),AIGC 真正的分水嶺不在于是否使用 AI,而在于能否將 AI 融入核心創(chuàng)作流程。如果 AI 不能理解創(chuàng)作者真實(shí)的工作方式,不能融入實(shí)際的生產(chǎn)流程,它就永遠(yuǎn)停留在 " 好看但不好用 " 的階段。
1 月 29 日,AIGC 軟件 A 股上市公司萬興科技(300624.SZ)推出全鏈路漫劇創(chuàng)作平臺(tái)萬興劇廠,并千萬級(jí)投資頭部漫劇制作廠商杭州靈漫快創(chuàng),形成 " 技術(shù)賦能內(nèi)容創(chuàng)作,真實(shí)場(chǎng)景反哺技術(shù)迭代 " 的深度協(xié)同。
2 月 5 日,萬興科技再宣布斥資,以數(shù)千萬元對(duì)生數(shù)科技 Vidu 進(jìn)行戰(zhàn)略投資,同時(shí)雙方正式達(dá)成戰(zhàn)略合作,將進(jìn)行 " 大模型 + 工具 + 場(chǎng)景 " 的生態(tài)級(jí)共創(chuàng),打造 AI 漫劇工業(yè)化生產(chǎn)新范式。
萬興科技戰(zhàn)略投資總經(jīng)理吳佳兵(左)、生數(shù)科技首席執(zhí)行官駱怡航(右)出席戰(zhàn)略投資合作簽約儀式
萬興科技密集投資標(biāo)桿企業(yè),是產(chǎn)業(yè)鏈上下游正在合力攻克 AI 視頻生成的 " 可控性 " 難題的標(biāo)志,并將場(chǎng)景聚焦于具有廣闊前景的 AI 漫劇賽道。AI 視頻行業(yè)正在調(diào)整升級(jí)發(fā)展路線,從追求單點(diǎn)生成的驚艷效果,轉(zhuǎn)向解決連續(xù)敘事的一致性難題,試圖將不可控的隨機(jī)生成,轉(zhuǎn)化為具體場(chǎng)景中可控的、完整的內(nèi)容。
解決一致性難題
對(duì)于漫劇和短劇的創(chuàng)作者而言,目前最大的成本是篩選廢片。
萬興科技戰(zhàn)略投資總經(jīng)理吳佳兵在投資簽約現(xiàn)場(chǎng)分享了一組數(shù)據(jù),在缺乏有效控制手段的情況下,創(chuàng)作者的 " 抽卡率 "(生成成功率)僅為 40%。
這意味著,為了得到一個(gè)可用的鏡頭,創(chuàng)作者需要進(jìn)行多次無效嘗試,這直接推高了算力成本和時(shí)間成本。
在商業(yè)視頻制作中,一致性是底線。
角色的一致性、場(chǎng)景的一致性、動(dòng)作邏輯的一致性,構(gòu)成了敘事的基礎(chǔ)。一旦角色在鏡頭切換中發(fā)生形變,觀眾的沉浸感就會(huì)瞬間被打斷。
萬興科技選擇投資生數(shù)科技,核心考量之一就在于其旗下產(chǎn)品 Vidu 對(duì) " 生成視頻一致性 " 的聚焦攻堅(jiān)。生數(shù)科技 CEO 駱怡航透露,最新的 Vidu Q3 參考生視頻(Reference-to-Video)模型,在多主體參考、音畫同步、細(xì)節(jié)生成等一致性的關(guān)鍵技術(shù)衡量指標(biāo)中獲得突破性進(jìn)展。
這被視為解決商業(yè)視頻痛點(diǎn)的關(guān)鍵。
在過去的創(chuàng)作邏輯中,AI 模型主要依賴 " 提示詞 "(Prompt)來猜測(cè)畫面,這種方式本質(zhì)上是在進(jìn)行概率博弈。
比如,創(chuàng)作者希望角色打出一套 " 降龍十八掌 ",在舊的模式下,創(chuàng)作者需要花費(fèi)大量精力去描述動(dòng)作的軌跡、力度和幅度。
即便如此,生成的畫面往往是變形或不符合物理規(guī)律的,為了解決這個(gè)問題,創(chuàng)作者通常會(huì)截取電視劇中喬峰打降龍十八掌的關(guān)鍵幀圖片作為參考,但圖片只能提供靜態(tài)的姿勢(shì),無法傳遞動(dòng)態(tài)的韻律。
現(xiàn)在的邏輯發(fā)生了變化。
通過 Vidu" 參考生視頻 " 技術(shù),創(chuàng)作者可以直接上傳一段五到八秒的視頻片段,這段視頻可以是截取的影視素材,也可以是真人實(shí)拍的演示。Vidu 模型能夠識(shí)別視頻中的動(dòng)作邏輯和情緒特征,并將其 " 遷移 " 到生成的動(dòng)漫角色身上。
生數(shù)科技行業(yè)解決方案負(fù)責(zé)人李震在演示中展示了一個(gè)具體的案例,一段真人在面館里掩面哭泣的視頻作為參考。
視頻中的人物情緒悲傷,手部動(dòng)作細(xì)膩。系統(tǒng)將這一視頻作為輸入條件后,生成的金發(fā)女郎角色完美復(fù)刻了這一悲傷的情緒和肢體動(dòng)作,甚至連掩面時(shí)的節(jié)奏都保持了一致。
這種技術(shù)路徑不僅解決了動(dòng)作的一致性,還解決了場(chǎng)景特效復(fù)刻的難題。
在漫劇創(chuàng)作中,打斗特效是一個(gè)高頻需求。
演示中展示了一個(gè)天花板漏水的場(chǎng)景視頻,通過參考生視頻技術(shù),創(chuàng)作者將這一物理現(xiàn)象復(fù)刻到了自己的漫劇場(chǎng)景中。
同樣,如果參考視頻的地面是白色地毯,創(chuàng)作者可以通過指令將其修改為網(wǎng)格狀地面,而不需要重新生成整個(gè)場(chǎng)景。
除了動(dòng)作和場(chǎng)景,角色形象的穩(wěn)定性是另一個(gè)核心指標(biāo)。
Vidu Q3 支持 " 音畫同出 " 與口型匹配。
在傳統(tǒng)的 AI 視頻制作流程中,視頻生成和配音是割裂的兩個(gè)環(huán)節(jié)。創(chuàng)作者生成視頻后,需要使用專門的口型軟件去匹配音頻,這往往導(dǎo)致口型僵硬或不同步。
Vidu Q3 模型能夠?qū)崿F(xiàn)視頻生成與音頻生成的同步,支持中文、英文、日文等多種語(yǔ)言,角色說話時(shí)的面部肌肉運(yùn)動(dòng)與語(yǔ)音內(nèi)容實(shí)現(xiàn)了同步。
在 Vidu Q3 模型演示片段中,兩個(gè)角色進(jìn)行對(duì)話,甚至出現(xiàn)了三人對(duì)話中 " 搶話 " 的場(chǎng)景,角色的口型和表情依然保持了自然。
這種對(duì)現(xiàn)實(shí)世界還原能力的提升,直接降低了商業(yè)創(chuàng)作的門檻。
商業(yè)價(jià)值建立在確定性之上,通過技術(shù)手段約束 AI 的隨機(jī)性,確保角色、場(chǎng)景、動(dòng)作在連續(xù)鏡頭中的統(tǒng)一,是 AI 視頻從 " 玩具 " 邁向 " 工具 " 的必要前提。
集成者的工作流
在 AI 視頻的產(chǎn)業(yè)鏈條中,分工正在變得明確,大模型廠商負(fù)責(zé)提升底層能力的上限,應(yīng)用廠商負(fù)責(zé)降低使用門檻和整合工作流。
生數(shù)科技專注于提升模型的參數(shù)規(guī)模、生成速度和物理模擬能力,而萬興科技的角色是集成和賦能者。
單純的模型調(diào)用無法滿足復(fù)雜的劇集制作需求,一個(gè)完整的漫劇項(xiàng)目,包含劇本拆解、分鏡設(shè)計(jì)、角色設(shè)定、視頻生成、后期剪輯等多個(gè)環(huán)節(jié),如果創(chuàng)作者需要在 ChatGPT 里寫劇本,在 Midjourney 里生圖,在 Runway 里生視頻,再到剪輯軟件里合成,這種割裂的操作體驗(yàn)本身就是效率的殺手。
萬興科技推出的 " 萬興劇廠 " 平臺(tái),正好解決這個(gè)低效的問題。
這是一個(gè)集成了多種頂尖模型的平臺(tái)。
萬興劇廠不僅接入了生數(shù)科技的 Vidu 模型,還率先接入了快手的 Kling 3.0(可靈)、字節(jié)的即夢(mèng) 5.0 等目前業(yè)界最領(lǐng)先的視覺模型。
這種 " 多模驅(qū)動(dòng) " 的策略,源于萬興科技對(duì)不同模型特性的判斷。以 Agent 實(shí)現(xiàn)智能劇本資產(chǎn)提取、智能分鏡創(chuàng)作;通過專業(yè)導(dǎo)演深度參與和頂尖算法,針對(duì)不同題材不同風(fēng)格的漫劇場(chǎng)景,為用戶智能匹配模型;通過提示詞工程,降低抽卡率,進(jìn)一步實(shí)現(xiàn)降本增效。
吳佳兵指出,萬興科技不直接研發(fā)底層通用大模型,而是通過 " 自研 + 投資 + 合作 " 的方式,把市場(chǎng)上最好的引擎裝進(jìn)自己的車?yán)铩?/p>
不同的模型有不同的特長(zhǎng)。
Vidu Q3 在音畫同步和角色一致性上表現(xiàn)突出;快手的 Kling 3.0 在長(zhǎng)視頻生成和物理模擬上具有優(yōu)勢(shì);谷歌的模型則在語(yǔ)義理解上更為精準(zhǔn)。萬興科技的任務(wù),是將這些模型的 API 接口封裝進(jìn)一個(gè)統(tǒng)一的界面,讓用戶無需在不同的網(wǎng)頁(yè)之間跳轉(zhuǎn)。
為了解決資產(chǎn)復(fù)用的問題,萬興科技在萬興劇廠引入了 " 知識(shí)庫(kù) " 的概念。
在傳統(tǒng)的創(chuàng)作中,每一次生成都是獨(dú)立的。但在連續(xù)劇中,主要角色、主要場(chǎng)景、特定的運(yùn)鏡方式(如推拉搖移)、特定的特效(如大招光效)是需要反復(fù)調(diào)用的。
" 知識(shí)庫(kù) " 允許創(chuàng)作者將這些元素封裝成可復(fù)用的 " 資產(chǎn) "。
比如,一個(gè)特定的 " 中心構(gòu)圖 " 提示詞,或者一個(gè) " 鏡頭跟隨 " 的運(yùn)鏡方式,都可以被保存為資產(chǎn)。當(dāng)創(chuàng)作者需要使用時(shí),只需像在社交媒體上 @某人一樣,直接調(diào)用這些資產(chǎn)。這就像是玩樂高積木,積木塊是固定的,創(chuàng)作者只需要負(fù)責(zé)拼搭。
萬興科技戰(zhàn)略投資總經(jīng)理吳佳兵在簽約現(xiàn)場(chǎng)披露了實(shí)測(cè)數(shù)據(jù),相比傳統(tǒng)的 AI 創(chuàng)作方式,萬興劇廠整合后的工作流使單集漫劇創(chuàng)作周期提速 8 倍。
更直觀的影響體現(xiàn)在成本上,由于 " 抽卡成功率 " 從 40% 提升到了 80% 以上,廢片率大幅降低,推進(jìn)算力成本降低了 55%,綜合計(jì)算,整劇的人力成本下降了 72%,項(xiàng)目總成本降低了 60% 以上。
一站式精品漫劇創(chuàng)作平臺(tái)萬興劇廠專為 2D 漫劇、AI 真人劇、3D 漫劇等打造
對(duì)于那些靠制作短劇為生的短漫劇制作公司、AIGC 影視工作室來說,萬興科技通過模型及工具賦能,給予了它們生存能力的質(zhì)變,技術(shù)的價(jià)值需要通過產(chǎn)品來釋放,通過將不同特長(zhǎng)的模型封裝進(jìn)標(biāo)準(zhǔn)化的工作流,將傳統(tǒng)需要數(shù)月完成的漫劇制作周期壓縮 5-7 天,萬興科技解決了創(chuàng)作者在不同工具間頻繁切換的割裂感,逐步建立起工業(yè)化的創(chuàng)作標(biāo)準(zhǔn)。
漫劇市場(chǎng)的產(chǎn)能升級(jí)
產(chǎn)能的提升,直接指向了漫?。ˋI Comic Video)市場(chǎng)的爆發(fā)。
行業(yè)數(shù)據(jù)顯示,漫劇市場(chǎng)規(guī)模預(yù)計(jì)在 2025 年達(dá)到 168 億元,2026 年將突破 243 億元,與此同時(shí),漫劇內(nèi)容的播放量在 2025 年已經(jīng)超過了 7000 億次。
這個(gè)市場(chǎng)正在經(jīng)歷結(jié)構(gòu)性的變化。
2025 年,市場(chǎng)上充斥著大量粗制濫造的 " 沙雕漫 ",這類內(nèi)容制作簡(jiǎn)單,往往只有簡(jiǎn)單的畫面移動(dòng)和配音,依靠獵奇的劇情吸引流量。
進(jìn)入 2026 年,隨著用戶審美疲勞,精品化漫劇成為主流,央視推出了兩大精品漫劇項(xiàng)目,各大視頻平臺(tái)也開始調(diào)整算法權(quán)重,扶持高質(zhì)量?jī)?nèi)容。
2026 年 1 月,全網(wǎng)熱播榜 TOP100 的漫劇里,精品漫劇占據(jù)了頭部位置。
一個(gè)典型的案例是,靈漫快創(chuàng)在春節(jié)檔推出的三部作品均躋身多平臺(tái)日榜前列。其中,《我在驚悚游戲開診所》登頂日榜 Top15,《吞噬進(jìn)化:從螞蟻吃到神明》躋身日榜 Top22 ,而《氣運(yùn)三角洲,我憑操作吊打全球》一上線即爆,播放量 29 小時(shí)內(nèi)狂飆至 2 億次,同步上榜多平臺(tái)漫劇日榜 Top1。靈漫反饋,該劇由靈漫一支 3 人專項(xiàng)團(tuán)隊(duì)利用萬興劇廠僅用時(shí) 5 天完成。這在傳統(tǒng)影視制作中是不可想象的。
萬興劇廠賦能靈漫快創(chuàng)多部漫劇春節(jié)檔霸榜,氣運(yùn)三角洲 29 小時(shí)破 2 億
精品化意味著更高的制作門檻,對(duì)于大量持有 IP 的網(wǎng)文平臺(tái)和制作公司而言,他們手里有百萬字的文字劇本,但缺乏將其轉(zhuǎn)化為視頻的產(chǎn)能。
傳統(tǒng)的影視制作周期長(zhǎng)、資金重,無法消化海量的網(wǎng)文 IP,萬興科技與生數(shù)科技的合作,旨在提供一套能夠規(guī)模化生產(chǎn)精品內(nèi)容的解決方案。
這套解決方案的核心,是將 " 導(dǎo)演思維 " 引入 AI 創(chuàng)作。
通過 Vidu Q3 的鏡頭控制能力,創(chuàng)作者可以實(shí)現(xiàn)推、拉、搖、移等專業(yè)的運(yùn)鏡效果,而不是生成一張只會(huì)眨眼的動(dòng)態(tài)圖片。
李震在演示中展示了一個(gè) " 千軍萬馬 " 的過場(chǎng)鏡頭。
在 AI 生成的畫面中,馬蹄聲由遠(yuǎn)及近,聲音由小變大,畫面清晰度保持在 1080P。這種宏大場(chǎng)面的生成,過去需要昂貴的特效團(tuán)隊(duì),現(xiàn)在通過模型直出即可完成。
這種產(chǎn)能的釋放,不僅改變了供給端,也可能改變消費(fèi)端。
駱怡航認(rèn)為,隨著生產(chǎn)力的提升,作品的豐富度和質(zhì)量將大幅提高,以前看網(wǎng)文的用戶,現(xiàn)在可以看到視頻化的展示。未來,隨著模型的發(fā)展,可能會(huì)衍生出互動(dòng)劇等更多的消費(fèi)方式。
區(qū)域市場(chǎng)上看,在國(guó)內(nèi),隨著 00 后消費(fèi)群體的崛起,對(duì)于虛擬內(nèi)容的消費(fèi)習(xí)慣也正在養(yǎng)成。海外市場(chǎng)對(duì)短劇內(nèi)容等虛擬內(nèi)容的消費(fèi)需求同樣旺盛,且具有較強(qiáng)的內(nèi)容付費(fèi)意愿。Steam 平臺(tái)上 50% 的用戶來自中國(guó),泡泡瑪特的全球熱銷,都證明了這一趨勢(shì)。
作為業(yè)務(wù)覆蓋 200 多個(gè)國(guó)家和地區(qū)的出海企業(yè),萬興科技在深圳、長(zhǎng)沙設(shè)立雙總部,并將這種工業(yè)化的生產(chǎn)能力輸出到全球市場(chǎng)。在海外,旗下以 Wondershare Filmora 為代表的產(chǎn)品已接入了谷歌的 Nano Banana Pro 等先進(jìn)模型,服務(wù)全球創(chuàng)作者。
在合規(guī)層面,AI 內(nèi)容創(chuàng)作上的 IP 版權(quán)、肖像權(quán)等復(fù)雜法律風(fēng)險(xiǎn)尤受行業(yè)關(guān)注。萬興科技建立了自己的 AI 倫理審查委員會(huì),并接入了先進(jìn)的鑒敏工具。這種合規(guī)能力,是其構(gòu)建全球創(chuàng)作者生態(tài)的隱形護(hù)城河。
駱怡航在簽約儀式上預(yù)測(cè),AI 視頻技術(shù)距離天花板還有 3 到 5 年的發(fā)展期。
目前的 Q3 版本雖然在部分指標(biāo)上對(duì)標(biāo)甚至超越了 Sora,但仍有進(jìn)化的空間。長(zhǎng)時(shí)長(zhǎng)的生成、進(jìn)一步的高清穩(wěn)定性,都是未來技術(shù)突破的方向。
在這個(gè)過程中,誰(shuí)能率先建立起穩(wěn)定、高效、低門檻的生產(chǎn)體系,誰(shuí)就能在內(nèi)容產(chǎn)業(yè)的變革中占據(jù)主動(dòng)。
萬興科技董事長(zhǎng)吳太兵表示,萬興不希望成為替代創(chuàng)作者的角色,而是通過降低門檻,把表達(dá)空間真正打開。