美國科技巨頭Meta近日發(fā)布了Movie Gen,號(hào)稱是“最先進(jìn)的媒體基礎(chǔ)模型”。據(jù)悉,Movie Gen可生成1080P、16秒、每秒16幀的高清長視頻,其不但可以通過文本輸入生成視頻,還可以通過文本對(duì)現(xiàn)有視頻進(jìn)行編輯修改,據(jù)稱逼真程度超越大半年前掀起一波文生視頻熱潮的Sora。不過,也僅此而已。行業(yè)并沒有掀起太大波瀾。
事實(shí)上,不只是Movie Gen被冷落,曾經(jīng)全球爆紅的快手可靈,字節(jié)的即夢(mèng)AI,國外的Runway、Luma AI、Pika等都日漸降溫,而Sora則至今未能正式上線。
一度熾熱的AI視頻生成賽道,難道真如百度董事長兼CEO李彥宏最新點(diǎn)評(píng)般,“Sora這種視頻生成的投入周期太長,10年、20年都可能拿不到業(yè)務(wù)收益”,就此“涼涼”了?
1
視頻生成的AI熱
2024年2月,Sora的橫空出世給AI及視頻創(chuàng)作領(lǐng)域都帶來一波新沖擊。Sora不僅對(duì)文本理解更深刻,可以準(zhǔn)確地呈現(xiàn)提示詞,而且能在一個(gè)生成的視頻中創(chuàng)建多個(gè)鏡頭,準(zhǔn)確地保留角色和視覺風(fēng)格,生成長達(dá)1分鐘的質(zhì)量驚艷的視頻,讓無數(shù)人驚嘆:“以后可能不需要人拍電影了!”
據(jù)德邦證券統(tǒng)計(jì),自Sora首次亮相以來,全球已有十多家公司發(fā)布或更新了視頻生成模型。
2024年夏天以來,AI視頻生成賽道變得異常熾熱。Runway、Pika、Luma AI、Stability AI等新興項(xiàng)目搶先推出比Sora更好用的AI視頻生成工具,并免費(fèi)提供給用戶。
其中,Runway9月的新品已將視頻生成時(shí)長延長至40秒,幾乎追平Sora展示的效果;Luma AI比Sora效果更真實(shí)還免費(fèi),在全球知名數(shù)據(jù)機(jī)構(gòu)SimilarWeb統(tǒng)計(jì)的全球AI產(chǎn)品訪問量為AI視頻生成類工具排名第一;Pika也在2024年10月推出Pika 1.5,更真實(shí)的運(yùn)動(dòng)效果和大屏幕鏡頭堪稱驚艷;直到Meta最新發(fā)布的自帶配音的文生視頻模型Movie Gen,直接用一個(gè)完整的評(píng)測(cè)體系宣告自己打敗Sora。
在中國,AI創(chuàng)企和科技巨頭也已推出多款“中國造Sora”。愛詩科技、生數(shù)科技、智象未來、Morph Studio、智譜AI、Minimax等AI創(chuàng)企都已推出了公眾可用的AI視頻生成工具,具有高壓縮率、優(yōu)良的文本響應(yīng)能力以及多樣化風(fēng)格,能夠生成媲美電影質(zhì)感的高分辨率、高幀率視頻。
字節(jié)跳動(dòng)、快手、騰訊等科技巨頭也都相繼入場(chǎng)攪局??焓纸衲?月推出的可靈AI,8月訪問量已達(dá)1448萬,環(huán)比增長591.54%,在AI視頻生成賽道排名僅次于Luma AI,成為全球現(xiàn)象級(jí)爆紅產(chǎn)品,而字節(jié)推出的即夢(mèng)AI憑借CapCut(剪映)也已成為許多短視頻博主創(chuàng)作必備工具。
2
大家“玩”厭了?
然而,在項(xiàng)目首次曝光8個(gè)月后的今天,Sora并沒有如OpenAI的其他AI產(chǎn)品般普及開來,而是不斷傳出“難產(chǎn)”消息。
實(shí)際上,據(jù)外媒近期報(bào)道,一些試用了Sora的電影制作人透露體驗(yàn)并不太理想,問題包括Sora生成的視頻在呈現(xiàn)提示詞上不夠準(zhǔn)確,生成視頻耗時(shí)久、一致性保持不足等。此外,“恐怖谷”效應(yīng)多發(fā),如生成的視頻總是包含奇怪的物理現(xiàn)象,比如憑空出現(xiàn)一把椅子,或者錯(cuò)誤地解剖分割事物,等等。換句話說,市面上AI視頻生成工具有的“翻車”場(chǎng)面,Sora也都有。
與此同時(shí),今年入秋以來,不少紅極一時(shí)的類Sora產(chǎn)品同樣熱度驟降。
今年9月,根據(jù)InfoQ等科技媒體聯(lián)合推出的AI產(chǎn)品榜·全球降速榜,上榜的前五名中有兩名都是AI視頻生成工具:Luma AI 9月訪問量環(huán)比下降38.49%,Viggle 9月訪問量環(huán)比下跌36.13%。
另據(jù)SimilarWeb數(shù)據(jù),全球眾多AI產(chǎn)品2024年8月訪問量繼續(xù)上漲,卻未出現(xiàn)一個(gè)AI視頻生成工具。排名22的Luma AI,訪問量僅1920萬,環(huán)比下跌14.9%。
在科技巨頭方面,無論是國外的Meta、谷歌,還是國內(nèi)的阿里、騰訊、百度等,至今沒有推出全民級(jí)的AI視頻生成產(chǎn)品,最多只是些試水式動(dòng)作。
有視頻創(chuàng)作者表示,單以產(chǎn)品來說,這些AI視頻工具各具優(yōu)點(diǎn)。比如海螺AI以其優(yōu)秀的動(dòng)畫、鏡頭運(yùn)用和人物情感表達(dá)而著稱;Vidu在語義理解、特效2D動(dòng)畫、一致性等表現(xiàn)出色;Runway則以其較高的分辨率、優(yōu)秀的畫面質(zhì)感成為廣告行業(yè)的理想選擇;而可靈則因其平衡的性能而被視為多面手。
不過,上述創(chuàng)作者還指出,文生視頻大多時(shí)候更像是愛好者的“玩具”,難以滿足商業(yè)需求。因?yàn)樵诙虅≈谱髦?,需要確保人物形象和其他元素的一致性,而文生視頻往往只能生成幾秒鐘的內(nèi)容,且下一秒的內(nèi)容可能會(huì)發(fā)生變化,這顯然無法滿足專業(yè)制作的要求。此外,視頻中的物理規(guī)律是否符合常識(shí)也是一個(gè)難點(diǎn)。
3
商業(yè)化前景嚴(yán)峻
近日,百度CEO李彥宏稱“百度不做Sora”的演講被媒體曝光,凸顯了AI視頻生成產(chǎn)品面臨的嚴(yán)峻挑戰(zhàn),也引發(fā)了“中國版Sora值不值得做”等更多相關(guān)話題的爭論。
李彥宏在內(nèi)部講話中稱,Sora這種視頻生成模型的投入周期太長,10年、20年都可能拿不到業(yè)務(wù)收益,無論多火爆,百度都不去做。
有批評(píng)者指出,除了前述的技術(shù)成熟度不足的共性問題外,生成式AI技術(shù)大幅降低視頻生成門檻的同時(shí),也對(duì)計(jì)算成本和效率提出了嚴(yán)峻的挑戰(zhàn)。比如在Luma AI的Dream Machine發(fā)布后,由于大量用戶涌入使用,服務(wù)器壓力過大,很多用戶需要排隊(duì)等待數(shù)小時(shí)才能得到生成的視頻,從而大大消耗了用戶的耐心,讓體驗(yàn)打折扣。從企業(yè)角度來說,提供AI視頻生成服務(wù)是一項(xiàng)遠(yuǎn)比聊天機(jī)器人更耗費(fèi)算力的工作,成本壓力大。
另外,雖然各家AI視頻生成工具都推出了免費(fèi)服務(wù),但大多都有次數(shù)和質(zhì)量的限制。以Dream Machine為例,其有29.99美元的標(biāo)準(zhǔn)檔、99.99美元的專業(yè)檔以及499.99美元的高級(jí)檔,高昂的價(jià)格使得當(dāng)下AI視頻生成工具的性價(jià)比大打折扣,影響其熱度進(jìn)一步提升。
從現(xiàn)實(shí)來講,在經(jīng)濟(jì)增長放緩的背景下,無論是消費(fèi)端用戶還是各行各業(yè)企業(yè)對(duì)AI投入都會(huì)更加謹(jǐn)慎。
以短視頻創(chuàng)作UGC市場(chǎng)為例,今年7月抖音和快手兩大短視頻廠商都親自下場(chǎng),分別推出《三星堆:未來啟示錄》《山海奇鏡之劈波斬浪》兩部AI生成短劇,盡管在平臺(tái)的帶動(dòng)下兩部AI短劇迅速播放破億,并吸引了不少創(chuàng)作者開始嘗試AI視頻生成。然而,時(shí)隔三個(gè)月,在各大平臺(tái)上并未看到AI生成短劇扎堆跟進(jìn)出現(xiàn)的勢(shì)頭。
一些嘗試過AI的短視頻創(chuàng)作者表示,主要因?yàn)楫?dāng)下內(nèi)容賽道競(jìng)爭激烈,變現(xiàn)更加艱難,他們更愿意從話題、內(nèi)容質(zhì)量等方面去提升而非增大技術(shù)成本投入。
支持者一方如火山引擎視頻云人士表示,當(dāng)前視頻數(shù)據(jù)的規(guī)模飛速增長,IDC預(yù)計(jì),2025年全球數(shù)據(jù)量將達(dá)到175ZB,其中絕大部分將來自視頻數(shù)據(jù),而這一趨勢(shì),還將繼續(xù)加速。技術(shù)的成熟,疊加應(yīng)用的爆發(fā),AI視頻的戰(zhàn)爭,正迎來市場(chǎng)化為導(dǎo)向的下半場(chǎng)。
中信建投一份最新研報(bào)則認(rèn)為,近期快手可靈、智譜、Runway等模型均開放視頻模型API,平均生成一段5s的視頻收費(fèi)在0.5—2元不等。展望未來,隨著AI視頻在C端娛樂社交、B端影視內(nèi)容制作等場(chǎng)景之下,應(yīng)用滲透率提升,疊加API成本的持續(xù)下降,AI視頻的商業(yè)化空間將打開。