长兴郴障科技有限公司

下載客戶端

登錄

+1

AI繪圖到底是天才畫手，還是潘多拉魔盒？

2022-08-16 07:15

來源：澎湃新聞·澎湃號·湃客

原創分享生活的靈感 Voicer

汽車在紐約上空飛行、中世紀居民頭戴VR眼鏡、宇航員在火星表面跳街舞、大衛雕塑愛打碟、古埃及的動物壁畫玩電腦……歡迎來到AI繪圖的世界！

輸入文字就能得到你想要的任何畫面，無論多么荒誕無理的要求，無論定制Edward Hopper畫風還是寶麗來膠片，AI都能“使命必達”。

聽上去如此夢幻的跨時代工具，似乎是下一波新技術浪潮的抬頭，2022也被稱為“AI繪圖元年”。但是它就像任何一項新技術一樣，難免伴隨爭議：究竟是開啟了一個全新繪畫時代，還是打開了潘多拉魔盒？無論你做何感想，AI繪圖時代已經不可逆轉地到來。

??

!ATTENTION!

以下圖片純屬AI虛構

如有雷同，純屬巧合

● “一個人坐在辦公室隔間里，用鍵盤打字，壓力重重的樣子 - 文藝復興繪畫風格”

● “金毛尋回犬小狗坐在小餐館里喝咖啡，看起來很憂郁 - Edward Hopper風格”

● “戰斗中戴著士兵頭盔的貓貓特寫 - 二戰歷史攝影風格，黑白”

● “一張非常細節、復古、顆粒感的紐約市汽車飛行照片（1936 年）”

● “宇航員b-boy組合在火星上表演 - 寶麗來風格”

● “用柯達專業Portra 400膠卷拍攝的外星人肖像 - 由Annie Leibovitz掌鏡”

● “米開朗基羅的大衛雕塑正戴著耳機打碟”

● “在太空邊緣奔跑，奔向星球，平靜，抵達深淵 - 數字藝術風格”

以上這些畫面都來自今年最熱門的AI繪圖平臺DALL·E 2（ig：@openaidalle），AI制作它們的時間，可能不到一分鐘。

不管是照片還是繪畫，你想到什么，AI就能呈現什么。真有那么神奇嗎？今天我們就先從DALL·E 2聊起。

創造奇跡的DALL·E 2

到底是何方神圣？

● DALL·E logo

作為AI繪圖的大勢平臺，DALL-E 2的火爆常常讓人忘記這個程序今年4月才剛剛推出。

初代DALL-E誕生于去年，在此基礎上進行了升級的DALL-E 2圖像分辨率更高，對指令的理解也更準確。

● 輸入“日出時狐貍坐在田野上的畫作，莫奈風格”，左右分別為第一代和第二代AI交出的作業

“DALL-E”的名字來自《機器人總動員》中的機器人瓦力（WALL-E）和超現實主義畫家達利（Dalí）。它也確實在功能上兼顧了兩者：一個能制作超現實主義圖像的機器人。

● 左：半人半機器版達利，右：瓦力版蒙娜麗莎，都由DALL·E 2繪制

在DALL-E 2宇宙里，腦洞有多大，世界就有多大。

你只需要給它一些描述語，包括畫面內容、參考畫風/畫家、形式（攝影/繪畫/雕塑）、工具（xx膠卷/鏡頭），剩下的就全部交給它。

● “古埃及壁畫上的動物神明正在使用計算機”

● “數千個星系的超深場天文學照片”?靈感來自韋伯望遠鏡拍下的圖像

比如說，可以畫成什么樣？DALL·E 2官網給出了兩組詞條：

A組詞條描述行為：

“像狂熱科學家一樣混合化學物質”

“購買雜貨”

“從事AI研究?”

B組詞條描述風格/狀態：

“兒童蠟筆藝術?”

“1980年代在月球上”

“和90年代科技產品一起待在水下”

“浮世繪風格”

……

把A組和B組連詞成句，就能得到以下這些奇妙結果。

●

不過，DALL·E 2不僅會創造圖像這么簡單，還可以在現成圖片上施展魔法。它能在照片里加入任何元素，并對陰影、反射和紋理進行細致處理，讓新照片毫無違和感。

比如，我們要求DALL·E 2在美術館照片上加一只柯基，并要求它分別出現在二次元畫作上和三次元展館里，AI就會自動計算柯基應該出現的樣子。

● 在照片的1??2??3??位置分別加入柯基會是什么效果？

當然你也可以丟給DALL·E 2一張畫作，讓它以此為靈感去創作，《戴珍珠耳環的少女》從此便有了多個模樣。

● DALL·E 2版《戴珍珠的少女》

● 給蒙娜麗莎換個莫西干頭發型，或是狗狗換小貓，都不在話下

DALL·E 2究竟是如何工作的？

OpenAI曾對此做過視頻解釋。和大多數AI一樣，DALL·E 2的根本原理是算法。通過深度學習大數據，從而掌握內在邏輯。運用在繪圖領域的話，就是對海量的主題圖片作歸類總結。

比如成千上萬的“考拉”圖片構成一個網絡，而“摩托車”圖片則是毫不相干的另一個。當用戶輸入“考拉騎摩托車”時，AI就把這兩個網絡交叉組合，并從中選出符合要求的圖片。

● 如果對DALL·E 2生成的結果不滿意，用戶可以進行修改，這些修改也在不斷幫助DALL·E 2變得更準確

AI繪畫正在占領賽博世界

● “機器人夢見電子羊”（cr：Sam Altman）

看到這里，如果你已經迫不及待要上手感受下DALL·E 2，那么很遺憾：DALL·E 2目前并未對大眾開放。雖然可以申請加入waitlist，但大多情況下你只能拿著愛的號碼牌，陷入無盡的等候。

遠水解不了近渴。一款與DALL·E 2極為相似、且對公眾開放的免費工具DALL-E mini引起了大家的興趣。

它與DALL·E 2并無直接關系（現已改名Crayon），功能卻基本一致。只要提交描述，它就能在極短時間內生成圖片——雖然質感與DALL·E 2存在肉眼可見的差距，但是對于圖個新鮮的網友們來說已經足夠。

● “泳池派對的黑客”（cr：weirddalle）

● “當黑武士遇見pingu”（cr：weirddalle）

● “腹語人偶版扎克伯格”（cr：weirddalle）

對于更“資深”一點的玩家來說，AI繪畫工具早已是任君挑選。除了DALL·E 2，如今受到關注的AI工具還包括：Disco Diffusion、Midjourney、NightCafe、wombo、CogView等等。

這些工具使用起來難易程度不一，比如CogView是國內團隊開發的AI工具，僅支持中文搜索。而Disco Diffusion充滿代碼的界面略為趕客，需要跟著教程一步步操作。

我們也玩了一把！

在AI繪圖app“dream by wombo”（可免費下載）上，我們試著以“voicer”為關鍵詞，分別生成了“吉卜力”“蒸汽朋克”“浮世繪”“達利”風格的圖片。

● 你最中意哪個？

當然最終效果也大多與AI工具的操作難易程度成正比。CogView生成的圖片多少帶點AI痕跡，而Disco Diffusion的玩家社區，早已成為浪漫想象力與美術功底的競技場。

這些原本就是高超畫手的用戶們，與Disco Diffusion不斷磨合調教，創作出無數難以辨別AI繪畫痕跡的優秀作品。

● “Father Time”（cr：@noah__proctor）

● 比起DALL·E 2，Disco Diffusion似乎更擅長描繪恢弘的場景（cr：@discodiffusion）

● Disco Diffusion社區用戶總結了在同一描述下，各個畫家的關鍵詞會生成的不同風格，截圖為其中一部分

雖然2022被成為“AI繪畫元年”，但“AI繪畫”絕非一個全新概念。

只是在這項技術發展早期，人們對此態度并不樂觀。而當時算法也還沒有那么強大，AI的作品停留在學齡前兒童水平。

● 即便是現在，DALL·E 2還是會生成兩個手掌長在一起這樣視覺錯亂的圖片

不過人們對于AI作畫的探索并未就此停止，反而奮勇向前。在互聯網流行AI作畫之前，實體AI作畫就已經受到不小的關注。

根據2018年的報道，當年國際機器人藝術大賽的獲獎名單里有不少對AI作畫的實驗。

加拿大藝術家Joanne Hastie制作了由編程控制繪畫的機械臂；美國藝術家Pindar Van Arman創造的AI機器人，可以模仿所給圖片繪畫；泰國機器人實驗室CMIT Robotics則可以捕捉人類在繪畫時的每一個動作軌跡，機器人通過精準復制動作，從而完整復刻人類的畫作。

● Joanne Hastie創造的抽象作品

● 只要人類先畫一遍，CMIT Robotics就能近乎完美地復刻

● Van Arman的AI機器人可以根據動態熱力圖來調整作畫

而在四年后的今天，AI機器人作畫顯然又向前邁進一大步。在今年威尼斯雙年展上亮相的AI藝術家“Ai-Da”，是一個擁有機械臂、外形酷似人類的機器人。

和街頭畫家一樣，Ai-Da用機械臂繪制人物肖像，并且配置了和人類對話的智能程序及發聲器，可以邊作畫邊與繪畫對象攀談。

● Ai-Da和她的自畫像

● Ai-Da的肖像作品

● 世界上第一幅由AI機器人繪制的英國女王肖像

天才畫手還是恐怖黑箱？

● “人們戴著VR眼鏡的中世紀畫作”，由DALL·E 2生成

當AI繪畫的實力越來越強勁，問題也隨之而來：它會替代傳統繪畫嗎？畫手們是否會面臨集體失業？

有人對此保持樂觀。畢竟雖然AI很強大，但本質上還是依賴人類的原創。它沒有獨立創造某種風格的能力，而Edward Hopper有。

● 無論美漫風格、數字藝術風格還是寶麗來，DALL·E 2都是參照人類創造出的現有風格

也有人對此非常悲觀。雖然高端畫師暫時還不會被取代，但是普通畫手的創作卻可能變得越來越不值錢。

此外，AI繪圖還面臨著更多問題。

一個月前，DALL·E 2發布了一張AI圖片，描述語為“一個男人舉起雙臂和雙手，用手勢表示‘這么多’”。

● DALL·E 2生成結果

這張生成圖片里的男子，有點像每年蘋果發布會上的喬布斯，立刻引發了網友不滿：為什么“一個男人”=“年輕的白人男性”？難道AI世界也奉行白人中心主義嗎？

但是考慮到DALL·E 2的運行邏輯，它也許只是這個充滿偏見的世界的縮影。

它的學習素材都來自人類的圖片——如果人類的圖片世界本身就充滿偏見和刻板印象，又怎么期待AI能根據“A man”的描述語生成黃種人或黑人？或者根據“護士”的描述語，生成男女比例對等的圖片？

● DALL·E 2生成的“建筑工人”圖片

● DALL·E 2生成的“空乘人員”圖片

更嚴重的問題可能來自法律糾紛。

AI繪圖是否會重蹈AI換臉技術的覆轍，被用來做一些侵犯他人權利的事情？如果AI能夠隨意生成他人的照片，那么狗仔們是否從此有了造謠利器，而政客們也有了陷害對手的把柄？

（亞利桑那州立大學計算機技術教授）

圖片版權是一個更難厘清的問題。關于AI生成圖片能否商用，各平臺眾口紛紜。通過學習他人畫作生成的作品，是否會侵犯到原作者權益？這給知識產權領域提出了新的思考。

如果AI繪圖有一天完全成為大眾工具，那么現實與虛擬的邊界無疑將被進一步模糊。

● 網友Aditya Ramesh使用DALL·E 2將維多利亞式房屋改造成現代房屋，把特斯拉變成老爺車，把iPhone變成老式電話

200年前攝影技術誕生時，給繪畫帶來的最大沖擊即是“真實感”——我們可以不相信繪畫，卻不能不相信一張真實的照片。然而200年后蓄勢待發的AI繪圖技術反其道而行之，進一步消解了圖像的真實性。

等到AI繪圖真的占領互聯網的那一天，我們還能相信眼睛看到的任何一張圖片嗎？

原標題：《AI繪圖到底是天才畫手，還是潘多拉魔盒？》

特別聲明

本文為澎湃號作者或機構在澎湃新聞上傳并發布，僅代表該作者或機構觀點，不代表澎湃新聞的觀點或立場，澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

+1

收藏

#藝術 #AI繪圖

查看更多

掃碼下載澎湃新聞客戶端

澎湃矩陣

澎湃新聞微博
澎湃新聞公眾號
澎湃新聞抖音號
IP SHANGHAI
SIXTH TONE

新聞報料

報料熱線: 021-962866
報料郵箱: news@thepaper.cn

滬ICP備14003370號

滬公網安備31010602000299號

互聯網新聞信息服務許可證：31120170006

增值電信業務經營許可證：滬B2-2017116

? 2014-2025 上海東方報業有限公司

反饋

至尊百家乐官网节目单| 百家乐官网赌经| 赌博中百家乐什么意思| 百家乐官网经验在哪找| 大发888洗码| 新葡京百家乐现金网| 大发888完整客户端| 百家乐官网大赌场娱乐网规则| 皇冠网文学网址| 贵族百家乐的玩法技巧和规则| 绥阳县| 顶级赌场371betcwm| 豪享博百家乐的玩法技巧和规则| 实战百家乐博彩正网| 互联网百家乐官网的玩法技巧和规则 | 百家乐官网网上真钱娱乐场开户注册| 至尊百家乐| 水果老虎机的规律| 百家乐真人娱乐平台| 段风水24宿| 百家乐官网的玩法技巧和规则| 百家乐官网注册平台排名| 康马县| 大发888被查封| 新濠峰百家乐的玩法技巧和规则| 百家乐官网澳门百家乐官网澳门赌场| 丰合国际娱乐网| 大发888在线娱乐城合营商| 长城百家乐游戏| 百家乐官网强弱走势图| 百家乐官网隔一数打投注法 | 伯爵百家乐娱乐场| 百家乐真人荷官| 哪家百家乐官网优惠最好且信誉不错 | 水果机游戏机遥控器| 威尼斯人娱乐城活动| 百家乐红桌布| 百家乐第三张规则| 博必发百家乐的玩法技巧和规则| 试玩百家乐网| 百家乐图淑何看|