长兴郴障科技有限公司

澎湃Logo
下載客戶端

登錄

  • +1

AI繪圖到底是天才畫手,還是潘多拉魔盒?

2022-08-16 07:15
來源:澎湃新聞·澎湃號·湃客
字號

原創 分享生活的靈感 Voicer

汽車在紐約上空飛行、中世紀居民頭戴VR眼鏡、宇航員在火星表面跳街舞、大衛雕塑愛打碟、古埃及的動物壁畫玩電腦……歡迎來到AI繪圖的世界!

輸入文字就能得到你想要的任何畫面,無論多么荒誕無理的要求,無論定制Edward Hopper畫風還是寶麗來膠片,AI都能“使命必達”。

聽上去如此夢幻的跨時代工具,似乎是下一波新技術浪潮的抬頭,2022也被稱為“AI繪圖元年”。但是它就像任何一項新技術一樣,難免伴隨爭議:究竟是開啟了一個全新繪畫時代,還是打開了潘多拉魔盒?無論你做何感想,AI繪圖時代已經不可逆轉地到來。

??

!ATTENTION!

以下圖片純屬AI虛構

如有雷同,純屬巧合

● “一個人坐在辦公室隔間里,用鍵盤打字,壓力重重的樣子 - 文藝復興繪畫風格”

● “金毛尋回犬小狗坐在小餐館里喝咖啡,看起來很憂郁 - Edward Hopper風格”

● “戰斗中戴著士兵頭盔的貓貓特寫 - 二戰歷史攝影風格,黑白”

● “一張非常細節、復古、顆粒感的紐約市汽車飛行照片(1936 年)”

● “宇航員b-boy組合在火星上表演 - 寶麗來風格”

● “用柯達專業Portra 400膠卷拍攝的外星人肖像 - 由Annie Leibovitz掌鏡”

● “米開朗基羅的大衛雕塑正戴著耳機打碟”

● “在太空邊緣奔跑,奔向星球,平靜,抵達深淵 - 數字藝術風格”

以上這些畫面都來自今年最熱門的AI繪圖平臺DALL·E 2(ig:@openaidalle),AI制作它們的時間,可能不到一分鐘。

不管是照片還是繪畫,你想到什么,AI就能呈現什么。真有那么神奇嗎?今天我們就先從DALL·E 2聊起。

創造奇跡的DALL·E 2

到底是何方神圣?

● DALL·E logo

作為AI繪圖的大勢平臺,DALL-E 2的火爆常常讓人忘記這個程序今年4月才剛剛推出。

初代DALL-E誕生于去年,在此基礎上進行了升級的DALL-E 2圖像分辨率更高,對指令的理解也更準確。

● 輸入“日出時狐貍坐在田野上的畫作,莫奈風格”,左右分別為第一代和第二代AI交出的作業

“DALL-E”的名字來自《機器人總動員》中的機器人瓦力(WALL-E)和超現實主義畫家達利(Dalí)。它也確實在功能上兼顧了兩者:一個能制作超現實主義圖像的機器人。

● 左:半人半機器版達利,右:瓦力版蒙娜麗莎,都由DALL·E 2繪制

在DALL-E 2宇宙里,腦洞有多大,世界就有多大。

你只需要給它一些描述語,包括畫面內容、參考畫風/畫家、形式(攝影/繪畫/雕塑)、工具(xx膠卷/鏡頭),剩下的就全部交給它。

● “古埃及壁畫上的動物神明正在使用計算機”

● “數千個星系的超深場天文學照片”?靈感來自韋伯望遠鏡拍下的圖像

比如說,可以畫成什么樣?DALL·E 2官網給出了兩組詞條:

A組詞條描述行為:

“像狂熱科學家一樣混合化學物質”

“購買雜貨”

“從事AI研究?”

B組詞條描述風格/狀態:

“兒童蠟筆藝術?”

“1980年代在月球上”

“和90年代科技產品一起待在水下”

“浮世繪風格”

……

把A組和B組連詞成句,就能得到以下這些奇妙結果。

不過,DALL·E 2不僅會創造圖像這么簡單,還可以在現成圖片上施展魔法。它能在照片里加入任何元素,并對陰影、反射和紋理進行細致處理,讓新照片毫無違和感。

比如,我們要求DALL·E 2在美術館照片上加一只柯基,并要求它分別出現在二次元畫作上和三次元展館里,AI就會自動計算柯基應該出現的樣子。

● 在照片的1??2??3??位置分別加入柯基會是什么效果?

當然你也可以丟給DALL·E 2一張畫作,讓它以此為靈感去創作,《戴珍珠耳環的少女》從此便有了多個模樣。

● DALL·E 2版《戴珍珠的少女》

● 給蒙娜麗莎換個莫西干頭發型,或是狗狗換小貓,都不在話下

DALL·E 2究竟是如何工作的?

OpenAI曾對此做過視頻解釋。和大多數AI一樣,DALL·E 2的根本原理是算法。通過深度學習大數據,從而掌握內在邏輯。運用在繪圖領域的話,就是對海量的主題圖片作歸類總結。

比如成千上萬的“考拉”圖片構成一個網絡,而“摩托車”圖片則是毫不相干的另一個。當用戶輸入“考拉騎摩托車”時,AI就把這兩個網絡交叉組合,并從中選出符合要求的圖片。

● 如果對DALL·E 2生成的結果不滿意,用戶可以進行修改,這些修改也在不斷幫助DALL·E 2變得更準確

AI繪畫正在占領賽博世界

● “機器人夢見電子羊”(cr:Sam Altman)

看到這里,如果你已經迫不及待要上手感受下DALL·E 2,那么很遺憾:DALL·E 2目前并未對大眾開放。雖然可以申請加入waitlist,但大多情況下你只能拿著愛的號碼牌,陷入無盡的等候。

遠水解不了近渴。一款與DALL·E 2極為相似、且對公眾開放的免費工具DALL-E mini引起了大家的興趣。

它與DALL·E 2并無直接關系(現已改名Crayon),功能卻基本一致。只要提交描述,它就能在極短時間內生成圖片——雖然質感與DALL·E 2存在肉眼可見的差距,但是對于圖個新鮮的網友們來說已經足夠。

● “泳池派對的黑客”(cr:weirddalle)

● “當黑武士遇見pingu”(cr:weirddalle)

● “腹語人偶版扎克伯格”(cr:weirddalle)

對于更“資深”一點的玩家來說,AI繪畫工具早已是任君挑選。除了DALL·E 2,如今受到關注的AI工具還包括:Disco Diffusion、Midjourney、NightCafe、wombo、CogView等等。

這些工具使用起來難易程度不一,比如CogView是國內團隊開發的AI工具,僅支持中文搜索。而Disco Diffusion充滿代碼的界面略為趕客,需要跟著教程一步步操作。

我們也玩了一把!

在AI繪圖app“dream by wombo”(可免費下載)上,我們試著以“voicer”為關鍵詞,分別生成了“吉卜力”“蒸汽朋克”“浮世繪”“達利”風格的圖片。

● 你最中意哪個?

當然最終效果也大多與AI工具的操作難易程度成正比。CogView生成的圖片多少帶點AI痕跡,而Disco Diffusion的玩家社區,早已成為浪漫想象力與美術功底的競技場。

這些原本就是高超畫手的用戶們,與Disco Diffusion不斷磨合調教,創作出無數難以辨別AI繪畫痕跡的優秀作品。

● “Father Time”(cr:@noah__proctor)

● 比起DALL·E 2,Disco Diffusion似乎更擅長描繪恢弘的場景(cr:@discodiffusion)

● Disco Diffusion社區用戶總結了在同一描述下,各個畫家的關鍵詞會生成的不同風格,截圖為其中一部分

雖然2022被成為“AI繪畫元年”,但“AI繪畫”絕非一個全新概念。

只是在這項技術發展早期,人們對此態度并不樂觀。而當時算法也還沒有那么強大,AI的作品停留在學齡前兒童水平。

● 即便是現在,DALL·E 2還是會生成兩個手掌長在一起這樣視覺錯亂的圖片

不過人們對于AI作畫的探索并未就此停止,反而奮勇向前。在互聯網流行AI作畫之前,實體AI作畫就已經受到不小的關注。

根據2018年的報道,當年國際機器人藝術大賽的獲獎名單里有不少對AI作畫的實驗。

加拿大藝術家Joanne Hastie制作了由編程控制繪畫的機械臂;美國藝術家Pindar Van Arman創造的AI機器人,可以模仿所給圖片繪畫;泰國機器人實驗室CMIT Robotics則可以捕捉人類在繪畫時的每一個動作軌跡,機器人通過精準復制動作,從而完整復刻人類的畫作。

● Joanne Hastie創造的抽象作品

● 只要人類先畫一遍,CMIT Robotics就能近乎完美地復刻

● Van Arman的AI機器人可以根據動態熱力圖來調整作畫

而在四年后的今天,AI機器人作畫顯然又向前邁進一大步。在今年威尼斯雙年展上亮相的AI藝術家“Ai-Da”,是一個擁有機械臂、外形酷似人類的機器人。

和街頭畫家一樣,Ai-Da用機械臂繪制人物肖像,并且配置了和人類對話的智能程序及發聲器,可以邊作畫邊與繪畫對象攀談。

● Ai-Da和她的自畫像

● Ai-Da的肖像作品

● 世界上第一幅由AI機器人繪制的英國女王肖像

天才畫手還是恐怖黑箱?

● “人們戴著VR眼鏡的中世紀畫作”,由DALL·E 2生成

當AI繪畫的實力越來越強勁,問題也隨之而來:它會替代傳統繪畫嗎?畫手們是否會面臨集體失業?

有人對此保持樂觀。畢竟雖然AI很強大,但本質上還是依賴人類的原創。它沒有獨立創造某種風格的能力,而Edward Hopper有。

● 無論美漫風格、數字藝術風格還是寶麗來,DALL·E 2都是參照人類創造出的現有風格

也有人對此非常悲觀。雖然高端畫師暫時還不會被取代,但是普通畫手的創作卻可能變得越來越不值錢。

此外,AI繪圖還面臨著更多問題。

一個月前,DALL·E 2發布了一張AI圖片,描述語為“一個男人舉起雙臂和雙手,用手勢表示‘這么多’”。

● DALL·E 2生成結果

這張生成圖片里的男子,有點像每年蘋果發布會上的喬布斯,立刻引發了網友不滿:為什么“一個男人”=“年輕的白人男性”?難道AI世界也奉行白人中心主義嗎?

但是考慮到DALL·E 2的運行邏輯,它也許只是這個充滿偏見的世界的縮影。

它的學習素材都來自人類的圖片——如果人類的圖片世界本身就充滿偏見和刻板印象,又怎么期待AI能根據“A man”的描述語生成黃種人或黑人?或者根據“護士”的描述語,生成男女比例對等的圖片?

● DALL·E 2生成的“建筑工人”圖片

● DALL·E 2生成的“空乘人員”圖片

更嚴重的問題可能來自法律糾紛。

AI繪圖是否會重蹈AI換臉技術的覆轍,被用來做一些侵犯他人權利的事情?如果AI能夠隨意生成他人的照片,那么狗仔們是否從此有了造謠利器,而政客們也有了陷害對手的把柄?

(亞利桑那州立大學計算機技術教授)

圖片版權是一個更難厘清的問題。關于AI生成圖片能否商用,各平臺眾口紛紜。通過學習他人畫作生成的作品,是否會侵犯到原作者權益?這給知識產權領域提出了新的思考。

如果AI繪圖有一天完全成為大眾工具,那么現實與虛擬的邊界無疑將被進一步模糊。

● 網友Aditya Ramesh使用DALL·E 2將維多利亞式房屋改造成現代房屋,把特斯拉變成老爺車,把iPhone變成老式電話

200年前攝影技術誕生時,給繪畫帶來的最大沖擊即是“真實感”——我們可以不相信繪畫,卻不能不相信一張真實的照片。然而200年后蓄勢待發的AI繪圖技術反其道而行之,進一步消解了圖像的真實性。

等到AI繪圖真的占領互聯網的那一天,我們還能相信眼睛看到的任何一張圖片嗎?

原標題:《AI繪圖到底是天才畫手,還是潘多拉魔盒?》

閱讀原文

    本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網安備31010602000299號

            互聯網新聞信息服務許可證:31120170006

            增值電信業務經營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業有限公司

            反饋
            至尊百家乐官网节目单| 百家乐官网赌经| 赌博中百家乐什么意思| 百家乐官网经验在哪找| 大发888洗码| 新葡京百家乐现金网| 大发888完整客户端| 百家乐官网大赌场娱乐网规则| 皇冠网文学网址| 贵族百家乐的玩法技巧和规则| 绥阳县| 顶级赌场371betcwm| 豪享博百家乐的玩法技巧和规则| 实战百家乐博彩正网| 互联网百家乐官网的玩法技巧和规则 | 百家乐官网网上真钱娱乐场开户注册| 至尊百家乐| 水果老虎机的规律| 百家乐真人娱乐平台| 段风水24宿| 百家乐官网的玩法技巧和规则| 百家乐官网注册平台排名| 康马县| 大发888被查封| 新濠峰百家乐的玩法技巧和规则| 百家乐官网澳门百家乐官网澳门赌场| 丰合国际娱乐网| 大发888在线娱乐城合营商| 长城百家乐游戏| 百家乐官网强弱走势图| 百家乐官网隔一数打投注法 | 伯爵百家乐娱乐场| 百家乐真人荷官| 哪家百家乐官网优惠最好且信誉不错 | 水果机游戏机遥控器| 威尼斯人娱乐城 活动| 百家乐红桌布| 百家乐第三张规则| 博必发百家乐的玩法技巧和规则| 试玩百家乐网| 百家乐图淑何看|