美國科技巨頭Meta近日發布了Movie Gen,號稱是“最先進的媒體基礎模型”。據悉,Movie Gen可生成1080P、16秒、每秒16幀的高清長視頻,其不但可以通過文本輸入生成視頻,還可以通過文本對現有視頻進行編輯修改,據稱逼真程度超越大半年前掀起一波文生視頻熱潮的Sora。不過,也僅此而已。行業并沒有掀起太大波瀾。
事實上,不只是Movie Gen被冷落,曾經全球爆紅的快手可靈,字節的即夢AI,國外的Runway、Luma AI、Pika等都日漸降溫,而Sora則至今未能正式上線。
一度熾熱的AI視頻生成賽道,難道真如百度董事長兼CEO李彥宏最新點評般,“Sora這種視頻生成的投入周期太長,10年、20年都可能拿不到業務收益”,就此“涼涼”了?
1
視頻生成的AI熱
2024年2月,Sora的橫空出世給AI及視頻創作領域都帶來一波新沖擊。Sora不僅對文本理解更深刻,可以準確地呈現提示詞,而且能在一個生成的視頻中創建多個鏡頭,準確地保留角色和視覺風格,生成長達1分鐘的質量驚艷的視頻,讓無數人驚嘆:“以后可能不需要人拍電影了!”
據德邦證券統計,自Sora首次亮相以來,全球已有十多家公司發布或更新了視頻生成模型。
2024年夏天以來,AI視頻生成賽道變得異常熾熱。Runway、Pika、Luma AI、Stability AI等新興項目搶先推出比Sora更好用的AI視頻生成工具,并免費提供給用戶。
其中,Runway9月的新品已將視頻生成時長延長至40秒,幾乎追平Sora展示的效果;Luma AI比Sora效果更真實還免費,在全球知名數據機構SimilarWeb統計的全球AI產品訪問量為AI視頻生成類工具排名第一;Pika也在2024年10月推出Pika 1.5,更真實的運動效果和大屏幕鏡頭堪稱驚艷;直到Meta最新發布的自帶配音的文生視頻模型Movie Gen,直接用一個完整的評測體系宣告自己打敗Sora。
在中國,AI創企和科技巨頭也已推出多款“中國造Sora”。愛詩科技、生數科技、智象未來、Morph Studio、智譜AI、Minimax等AI創企都已推出了公眾可用的AI視頻生成工具,具有高壓縮率、優良的文本響應能力以及多樣化風格,能夠生成媲美電影質感的高分辨率、高幀率視頻。
字節跳動、快手、騰訊等科技巨頭也都相繼入場攪局。快手今年7月推出的可靈AI,8月訪問量已達1448萬,環比增長591.54%,在AI視頻生成賽道排名僅次于Luma AI,成為全球現象級爆紅產品,而字節推出的即夢AI憑借CapCut(剪映)也已成為許多短視頻博主創作必備工具。
2
大家“玩”厭了?
然而,在項目首次曝光8個月后的今天,Sora并沒有如OpenAI的其他AI產品般普及開來,而是不斷傳出“難產”消息。
實際上,據外媒近期報道,一些試用了Sora的電影制作人透露體驗并不太理想,問題包括Sora生成的視頻在呈現提示詞上不夠準確,生成視頻耗時久、一致性保持不足等。此外,“恐怖谷”效應多發,如生成的視頻總是包含奇怪的物理現象,比如憑空出現一把椅子,或者錯誤地解剖分割事物,等等。換句話說,市面上AI視頻生成工具有的“翻車”場面,Sora也都有。
與此同時,今年入秋以來,不少紅極一時的類Sora產品同樣熱度驟降。
今年9月,根據InfoQ等科技媒體聯合推出的AI產品榜·全球降速榜,上榜的前五名中有兩名都是AI視頻生成工具:Luma AI 9月訪問量環比下降38.49%,Viggle 9月訪問量環比下跌36.13%。
另據SimilarWeb數據,全球眾多AI產品2024年8月訪問量繼續上漲,卻未出現一個AI視頻生成工具。排名22的Luma AI,訪問量僅1920萬,環比下跌14.9%。
在科技巨頭方面,無論是國外的Meta、谷歌,還是國內的阿里、騰訊、百度等,至今沒有推出全民級的AI視頻生成產品,最多只是些試水式動作。
有視頻創作者表示,單以產品來說,這些AI視頻工具各具優點。比如海螺AI以其優秀的動畫、鏡頭運用和人物情感表達而著稱;Vidu在語義理解、特效2D動畫、一致性等表現出色;Runway則以其較高的分辨率、優秀的畫面質感成為廣告行業的理想選擇;而可靈則因其平衡的性能而被視為多面手。
不過,上述創作者還指出,文生視頻大多時候更像是愛好者的“玩具”,難以滿足商業需求。因為在短劇制作中,需要確保人物形象和其他元素的一致性,而文生視頻往往只能生成幾秒鐘的內容,且下一秒的內容可能會發生變化,這顯然無法滿足專業制作的要求。此外,視頻中的物理規律是否符合常識也是一個難點。
3
商業化前景嚴峻
近日,百度CEO李彥宏稱“百度不做Sora”的演講被媒體曝光,凸顯了AI視頻生成產品面臨的嚴峻挑戰,也引發了“中國版Sora值不值得做”等更多相關話題的爭論。
李彥宏在內部講話中稱,Sora這種視頻生成模型的投入周期太長,10年、20年都可能拿不到業務收益,無論多火爆,百度都不去做。
有批評者指出,除了前述的技術成熟度不足的共性問題外,生成式AI技術大幅降低視頻生成門檻的同時,也對計算成本和效率提出了嚴峻的挑戰。比如在Luma AI的Dream Machine發布后,由于大量用戶涌入使用,服務器壓力過大,很多用戶需要排隊等待數小時才能得到生成的視頻,從而大大消耗了用戶的耐心,讓體驗打折扣。從企業角度來說,提供AI視頻生成服務是一項遠比聊天機器人更耗費算力的工作,成本壓力大。
另外,雖然各家AI視頻生成工具都推出了免費服務,但大多都有次數和質量的限制。以Dream Machine為例,其有29.99美元的標準檔、99.99美元的專業檔以及499.99美元的高級檔,高昂的價格使得當下AI視頻生成工具的性價比大打折扣,影響其熱度進一步提升。
從現實來講,在經濟增長放緩的背景下,無論是消費端用戶還是各行各業企業對AI投入都會更加謹慎。
以短視頻創作UGC市場為例,今年7月抖音和快手兩大短視頻廠商都親自下場,分別推出《三星堆:未來啟示錄》《山海奇鏡之劈波斬浪》兩部AI生成短劇,盡管在平臺的帶動下兩部AI短劇迅速播放破億,并吸引了不少創作者開始嘗試AI視頻生成。然而,時隔三個月,在各大平臺上并未看到AI生成短劇扎堆跟進出現的勢頭。
一些嘗試過AI的短視頻創作者表示,主要因為當下內容賽道競爭激烈,變現更加艱難,他們更愿意從話題、內容質量等方面去提升而非增大技術成本投入。
支持者一方如火山引擎視頻云人士表示,當前視頻數據的規模飛速增長,IDC預計,2025年全球數據量將達到175ZB,其中絕大部分將來自視頻數據,而這一趨勢,還將繼續加速。技術的成熟,疊加應用的爆發,AI視頻的戰爭,正迎來市場化為導向的下半場。
中信建投一份最新研報則認為,近期快手可靈、智譜、Runway等模型均開放視頻模型API,平均生成一段5s的視頻收費在0.5—2元不等。展望未來,隨著AI視頻在C端娛樂社交、B端影視內容制作等場景之下,應用滲透率提升,疊加API成本的持續下降,AI視頻的商業化空間將打開。