- +1
未來可期|Sora引領(lǐng)下的文生視頻時代:技術(shù)革新與產(chǎn)業(yè)創(chuàng)新
在這個不斷變化的世界里,人工智能(AI)技術(shù)就像是一位魔法師,每次揮動魔杖都帶給我們新的驚喜。
最近,它的一個新把戲是文生視頻,其中Sora平臺的推出尤為引人注目。只需輸入你想要的視頻內(nèi)容,AI就能創(chuàng)造出讓你目瞪口呆的視頻——從大片級別的電影場景,到讓人捧腹的動畫短片,應(yīng)有盡有。是的,你沒看錯:以Sora為代表的AI技術(shù)現(xiàn)在不僅是文字高手,能寫出讓人一笑倒地的段子;它還是視頻大師,能制作讓人眼睛一亮的視頻。隨著這項技術(shù)的飛速發(fā)展,我們的視覺體驗和創(chuàng)作方式都在經(jīng)歷一場革命。
2023年7月,網(wǎng)絡(luò)爆紅了一段全AI生成的混搭電影預(yù)告片——《芭本海默》(Barbenheimer)。這段預(yù)告片結(jié)合了電影《芭比》與《奧本海默》的元素,震撼效果堪比好萊塢大作。稍有缺憾的是,角色動作略顯僵硬,缺乏生命感,畫面細節(jié)也有待提升。但這段預(yù)告片無疑展示了人工智能生成內(nèi)容(Artificial Intelligence Generated Content,簡稱AIGC)技術(shù)迅猛的進化速度。
《芭本海默》的創(chuàng)作者Curious Refuge是一位熱愛探索的網(wǎng)絡(luò)創(chuàng)作者。他使用了Midjourney和Runway的Gen-2技術(shù)合成視頻,甚至連配音都是AI生成的,模仿了瑪格特·羅比和馬特·達蒙的聲線。令人驚訝的是,整個項目僅用一臺標(biāo)準(zhǔn)的MacBook Pro,在短短4天內(nèi)完成。
以預(yù)告片中令人印象深刻的粉色蘑菇云為例,Curious Refuge先是用Midjourney創(chuàng)造了一張粉色原子彈爆炸圖像,隨后將這張圖上傳至Gen-2服務(wù)器。無需任何額外的提示,瞬間就生成了4秒鐘震撼的電影場景。
這一切都指向了一個激動人心的未來:即便是在我們的家用電腦上,也能創(chuàng)作出令人矚目的影視作品。AIGC正在重塑內(nèi)容創(chuàng)作領(lǐng)域,一個新的產(chǎn)業(yè)——全AI電影制作,或許就此誕生。這意味著,不久的將來,我們每個人都有可能成為電影導(dǎo)演,用鍵盤和鼠標(biāo)編織出自己的電影夢。
想象一下,有一天你坐在家里,靈感突現(xiàn),你決定制作一部電影。你不需要找到一組演員,也不必擔(dān)心場地和天氣。你只需要和你的AI伙伴溝通,它能理解你的構(gòu)想,并迅速將它們變?yōu)楝F(xiàn)實。傳統(tǒng)上,一部電影的誕生需要龐大的團隊、昂貴的設(shè)備和漫長的時間。現(xiàn)在,只需幾天時間,一臺筆記本電腦,加上無限的想象力,任何人都能創(chuàng)造出視覺效果驚人的短片。
在全AI電影制作這條道路上,有一些先行者正在為這個夢想鋪路。Pika(https://pika.art/)的出現(xiàn),便是另一個生動的案例。這是一個由兩位斯坦福大學(xué)博士生創(chuàng)立的項目。他們覺得之前的制作視頻對于普通人而言,實在太過復(fù)雜。因此,他們決定讓視頻創(chuàng)作變得簡單,讓任何人都能輕松地按需創(chuàng)作視頻。
Pika1.0的功能十分強大,可以根據(jù)用戶輸入的文本提示詞,生成各種風(fēng)格的視頻,包括3D 動畫、動漫卡通以及電影等。它還有一個獨特的功能,就是可以讓用戶修改視頻的特定區(qū)域,而不需要重新生成整個視頻。例如,它調(diào)整視頻的寬高比、更改視頻中人物的衣服,給猩猩戴墨鏡……
2024年2月16日,OpenAI發(fā)布了革命性的文生視頻模型——Sora (https://openai.com/sora),再次引發(fā)了行業(yè)內(nèi)的巨大震動。Sora不僅能夠生成長達60秒的視頻,而且展現(xiàn)了精細的背景、復(fù)雜的鏡頭運用和充滿情感的角色表現(xiàn),這一能力遠遠超出了上文提到的Runway和Pika。
盡管Sora極具創(chuàng)新,但它也有自己的局限。OpenAI自己也承認(rèn),Sora在模擬復(fù)雜場景的物理原理上可能會遇到困難,對因果關(guān)系的理解也不盡完美。比如,角色吃餅干后,餅干可能仍然完整無損;玻璃破碎的細節(jié)也可能無法精確再現(xiàn)。
Sora的發(fā)布被一些人士視為內(nèi)容創(chuàng)作領(lǐng)域的“牛頓時刻”。YouTube博主Paddy Galloway表達了他對Sora的震撼之情:“在YouTube世界沉浸了15年后,OpenAI的這一展示讓我啞口無言……動畫師和3D藝術(shù)家可能要面臨挑戰(zhàn),素材庫可能變得不再重要。現(xiàn)在,任何人都能夠輕松獲得令人難以置信的創(chuàng)作成果,故事背后的‘想法’變得尤為重要。”這一評價不僅凸顯了Sora帶來的巨大變革,也預(yù)示著內(nèi)容創(chuàng)作行業(yè)的未來正在發(fā)生深刻變化。
當(dāng)我目睹Pika、Sora這些平臺時,我首先想到的是:未來的短視頻領(lǐng)域,將主要由文生視頻占領(lǐng)。這對現(xiàn)有的短劇市場既是巨大的推動力,也帶來了前所未有的沖擊。在當(dāng)前,視頻市場由“愛騰優(yōu)芒”這樣的巨頭占據(jù)優(yōu)勢。不久的將來,誰擁有獨特的故事,無論是動人的人生經(jīng)歷,還是奇幻的虛構(gòu)世界,都有機會成為視頻平臺的新霸主。
盡管人工智能能夠制作出高質(zhì)量的視頻,但視頻的靈魂——主題思想、腳本構(gòu)思、鏡頭安排、對白搭配,這些都離不開人類的創(chuàng)意火花。至少目前來看,人工智能還需要依賴于人給出的提示詞來創(chuàng)作。這一點,再次凸顯了人類創(chuàng)造力的不可替代性。在AI和人類協(xié)作的新時代,那些能夠?qū)⒓夹g(shù)與人性故事完美融合的創(chuàng)作者,將引領(lǐng)著未來短視頻的潮流。
如果我的推斷成真,文學(xué)網(wǎng)站如起點中文網(wǎng)、縱橫中文網(wǎng)、番茄小說和晉江文學(xué)城等,可能會成為新一代的視頻巨頭,成為未來的“愛騰優(yōu)芒”。他們手中握有的龐大文本資源,將成為制作新一輪流行視頻的寶貴資產(chǎn)。
首先,這些文學(xué)平臺需要做的是利用人工智能技術(shù),全面了解現(xiàn)有的影視內(nèi)容,包括在“愛騰優(yōu)芒”上發(fā)布的所有電影、電視劇和綜藝節(jié)目,以及抖音、快手等平臺上的熱門視頻。緊接著,將這些豐富的文本資料交給AI,讓它創(chuàng)造出全新的電影和電視劇內(nèi)容。盡管目前的技術(shù)限制AI只能生成時長為60秒的短視頻,完全由AI制作的長篇電影和電視劇似乎還遙不可及。但我們不能忽視技術(shù)發(fā)展的潛力。隨著時間的推移和技術(shù)的進步,那些曾在文學(xué)平臺上流連忘返的小說,可能真的一躍成為觀眾矚目的大片。
文生視頻平臺的出現(xiàn),使得沒有視頻制作經(jīng)驗的人也能輕松將創(chuàng)意變?yōu)楝F(xiàn)實。這是AI技術(shù)帶給內(nèi)容創(chuàng)作領(lǐng)域的革命性變化:技術(shù)門檻的降低,讓更多想法得以實現(xiàn)。借助Sora、Pika等平臺,我們看到了一個用戶驅(qū)動的創(chuàng)作生態(tài)的崛起。這里,每個人都有機會讓自己的夢想和故事躍然屏幕之上。技術(shù)的復(fù)雜度不再構(gòu)成障礙,這無疑將推動創(chuàng)意自由和文化多樣性的發(fā)展。
因此,全AI電影制作不僅僅是關(guān)于技術(shù)的革命。它還代表了一種創(chuàng)意的民主化,讓更多的聲音有機會被聽見。在這個新時代,無論你來自何方,背景如何,只要你有故事要講,AI都能幫你把它變成現(xiàn)實。
在AI的前一輪技術(shù)浪潮中,我們見證了決策式AI如何通過算法優(yōu)化提升效率,滿足市場和消費者對于快速匹配和推薦的需求。打車服務(wù)、旅游推薦和購物平臺等得到了長足的發(fā)展。而現(xiàn)在,生成式AI的興起標(biāo)志著一個新時代的到來——不僅僅滿足既有需求,更是創(chuàng)造全新的供給。這種供給不僅僅局限于傳統(tǒng)的文本、圖片生成,它延伸到新聞報道、廣告文案、視頻內(nèi)容、游戲設(shè)計,甚至編程和影視創(chuàng)作等多個領(lǐng)域。
這就是為什么在2024年杭州市新春第一會——“深化改革、強基固本”主題年推進大會上,杭州市委書記劉捷會兩次提到Sora大模型:“Sora大模型為數(shù)字經(jīng)濟創(chuàng)新發(fā)展打開了一扇大門,形成了引領(lǐng)人工智能產(chǎn)業(yè)發(fā)展的一個新的通道,這不僅帶來很大啟發(fā),更大地帶來了產(chǎn)業(yè)的沖擊”。Sora的出現(xiàn),不僅僅是技術(shù)上的一大步,更標(biāo)志著新供給的誕生,引領(lǐng)了人工智能產(chǎn)業(yè)的全新發(fā)展方向。
Sora等平臺為內(nèi)容創(chuàng)造者和技術(shù)開發(fā)者提供了革命性的工具,開啟了內(nèi)容創(chuàng)作的新紀(jì)元;同時,它們也為數(shù)字經(jīng)濟注入了新的活力和競爭領(lǐng)域,賦予了企業(yè)和創(chuàng)作者空前的機遇。這場從需求驅(qū)動到供給創(chuàng)新的變革,預(yù)示著未來產(chǎn)業(yè)的發(fā)展將更依賴于創(chuàng)新力和創(chuàng)造力。生成式AI的應(yīng)用正催生著眾多全新的產(chǎn)業(yè)機會,從內(nèi)容創(chuàng)作到智能編程,從娛樂媒體到教育培訓(xùn),每一個領(lǐng)域都將迎來變革。隨著新供給的不斷涌現(xiàn),我們有理由期待一個更加多元化、更加活躍的數(shù)字經(jīng)濟生態(tài)系統(tǒng)的形成。
讓我們進一步拓展想象:當(dāng)AI掌握了電影制作的魔法,游戲創(chuàng)造的王國也將很快納入它的版圖。假如這種技術(shù)與Vision Pro這樣的硬件設(shè)備聯(lián)姻,我們又將站在什么樣的新起點上?想象一下,未來的游戲行業(yè),不再是少數(shù)大型游戲公司的專屬戰(zhàn)場,而是成為廣大游戲愛好者、獨立開發(fā)者乃至任何有想法的人的創(chuàng)作樂園。這種變革,就像手握阿拉丁的神燈,可以釋放出無限的可能性。
(作者胡逸,一個喜歡暢想未來的大數(shù)據(jù)工作者。“未來可期”是胡逸在澎湃科技開設(shè)的獨家專欄。)





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司