长兴郴障科技有限公司

澎湃Logo
下載客戶端

登錄

  • +1

AI繪圖到底是天才畫手,還是潘多拉魔盒?

2022-08-16 07:15
來(lái)源:澎湃新聞·澎湃號(hào)·湃客
字號(hào)

原創(chuàng) 分享生活的靈感 Voicer

汽車在紐約上空飛行、中世紀(jì)居民頭戴VR眼鏡、宇航員在火星表面跳街舞、大衛(wèi)雕塑愛打碟、古埃及的動(dòng)物壁畫玩電腦……歡迎來(lái)到AI繪圖的世界!

輸入文字就能得到你想要的任何畫面,無(wú)論多么荒誕無(wú)理的要求,無(wú)論定制Edward Hopper畫風(fēng)還是寶麗來(lái)膠片,AI都能“使命必達(dá)”。

聽上去如此夢(mèng)幻的跨時(shí)代工具,似乎是下一波新技術(shù)浪潮的抬頭,2022也被稱為“AI繪圖元年”。但是它就像任何一項(xiàng)新技術(shù)一樣,難免伴隨爭(zhēng)議:究竟是開啟了一個(gè)全新繪畫時(shí)代,還是打開了潘多拉魔盒?無(wú)論你做何感想,AI繪圖時(shí)代已經(jīng)不可逆轉(zhuǎn)地到來(lái)。

??

!ATTENTION!

以下圖片純屬AI虛構(gòu)

如有雷同,純屬巧合

● “一個(gè)人坐在辦公室隔間里,用鍵盤打字,壓力重重的樣子 - 文藝復(fù)興繪畫風(fēng)格”

● “金毛尋回犬小狗坐在小餐館里喝咖啡,看起來(lái)很憂郁 - Edward Hopper風(fēng)格”

● “戰(zhàn)斗中戴著士兵頭盔的貓貓?zhí)貙?- 二戰(zhàn)歷史攝影風(fēng)格,黑白”

● “一張非常細(xì)節(jié)、復(fù)古、顆粒感的紐約市汽車飛行照片(1936 年)”

● “宇航員b-boy組合在火星上表演 - 寶麗來(lái)風(fēng)格”

● “用柯達(dá)專業(yè)Portra 400膠卷拍攝的外星人肖像 - 由Annie Leibovitz掌鏡”

● “米開朗基羅的大衛(wèi)雕塑正戴著耳機(jī)打碟”

● “在太空邊緣奔跑,奔向星球,平靜,抵達(dá)深淵 - 數(shù)字藝術(shù)風(fēng)格”

以上這些畫面都來(lái)自今年最熱門的AI繪圖平臺(tái)DALL·E 2(ig:@openaidalle),AI制作它們的時(shí)間,可能不到一分鐘。

不管是照片還是繪畫,你想到什么,AI就能呈現(xiàn)什么。真有那么神奇嗎?今天我們就先從DALL·E 2聊起。

創(chuàng)造奇跡的DALL·E 2

到底是何方神圣?

● DALL·E logo

作為AI繪圖的大勢(shì)平臺(tái),DALL-E 2的火爆常常讓人忘記這個(gè)程序今年4月才剛剛推出。

初代DALL-E誕生于去年,在此基礎(chǔ)上進(jìn)行了升級(jí)的DALL-E 2圖像分辨率更高,對(duì)指令的理解也更準(zhǔn)確。

● 輸入“日出時(shí)狐貍坐在田野上的畫作,莫奈風(fēng)格”,左右分別為第一代和第二代AI交出的作業(yè)

“DALL-E”的名字來(lái)自《機(jī)器人總動(dòng)員》中的機(jī)器人瓦力(WALL-E)和超現(xiàn)實(shí)主義畫家達(dá)利(Dalí)。它也確實(shí)在功能上兼顧了兩者:一個(gè)能制作超現(xiàn)實(shí)主義圖像的機(jī)器人。

● 左:半人半機(jī)器版達(dá)利,右:瓦力版蒙娜麗莎,都由DALL·E 2繪制

在DALL-E 2宇宙里,腦洞有多大,世界就有多大。

你只需要給它一些描述語(yǔ),包括畫面內(nèi)容、參考畫風(fēng)/畫家、形式(攝影/繪畫/雕塑)、工具(xx膠卷/鏡頭),剩下的就全部交給它。

● “古埃及壁畫上的動(dòng)物神明正在使用計(jì)算機(jī)”

● “數(shù)千個(gè)星系的超深場(chǎng)天文學(xué)照片”?靈感來(lái)自韋伯望遠(yuǎn)鏡拍下的圖像

比如說,可以畫成什么樣?DALL·E 2官網(wǎng)給出了兩組詞條:

A組詞條描述行為:

“像狂熱科學(xué)家一樣混合化學(xué)物質(zhì)”

“購(gòu)買雜貨”

“從事AI研究?”

B組詞條描述風(fēng)格/狀態(tài):

“兒童蠟筆藝術(shù)?”

“1980年代在月球上”

“和90年代科技產(chǎn)品一起待在水下”

“浮世繪風(fēng)格”

……

把A組和B組連詞成句,就能得到以下這些奇妙結(jié)果。

不過,DALL·E 2不僅會(huì)創(chuàng)造圖像這么簡(jiǎn)單,還可以在現(xiàn)成圖片上施展魔法。它能在照片里加入任何元素,并對(duì)陰影、反射和紋理進(jìn)行細(xì)致處理,讓新照片毫無(wú)違和感。

比如,我們要求DALL·E 2在美術(shù)館照片上加一只柯基,并要求它分別出現(xiàn)在二次元畫作上和三次元展館里,AI就會(huì)自動(dòng)計(jì)算柯基應(yīng)該出現(xiàn)的樣子。

● 在照片的1??2??3??位置分別加入柯基會(huì)是什么效果?

當(dāng)然你也可以丟給DALL·E 2一張畫作,讓它以此為靈感去創(chuàng)作,《戴珍珠耳環(huán)的少女》從此便有了多個(gè)模樣。

● DALL·E 2版《戴珍珠的少女》

● 給蒙娜麗莎換個(gè)莫西干頭發(fā)型,或是狗狗換小貓,都不在話下

DALL·E 2究竟是如何工作的?

OpenAI曾對(duì)此做過視頻解釋。和大多數(shù)AI一樣,DALL·E 2的根本原理是算法。通過深度學(xué)習(xí)大數(shù)據(jù),從而掌握內(nèi)在邏輯。運(yùn)用在繪圖領(lǐng)域的話,就是對(duì)海量的主題圖片作歸類總結(jié)。

比如成千上萬(wàn)的“考拉”圖片構(gòu)成一個(gè)網(wǎng)絡(luò),而“摩托車”圖片則是毫不相干的另一個(gè)。當(dāng)用戶輸入“考拉騎摩托車”時(shí),AI就把這兩個(gè)網(wǎng)絡(luò)交叉組合,并從中選出符合要求的圖片。

● 如果對(duì)DALL·E 2生成的結(jié)果不滿意,用戶可以進(jìn)行修改,這些修改也在不斷幫助DALL·E 2變得更準(zhǔn)確

AI繪畫正在占領(lǐng)賽博世界

● “機(jī)器人夢(mèng)見電子羊”(cr:Sam Altman)

看到這里,如果你已經(jīng)迫不及待要上手感受下DALL·E 2,那么很遺憾:DALL·E 2目前并未對(duì)大眾開放。雖然可以申請(qǐng)加入waitlist,但大多情況下你只能拿著愛的號(hào)碼牌,陷入無(wú)盡的等候。

遠(yuǎn)水解不了近渴。一款與DALL·E 2極為相似、且對(duì)公眾開放的免費(fèi)工具DALL-E mini引起了大家的興趣。

它與DALL·E 2并無(wú)直接關(guān)系(現(xiàn)已改名Crayon),功能卻基本一致。只要提交描述,它就能在極短時(shí)間內(nèi)生成圖片——雖然質(zhì)感與DALL·E 2存在肉眼可見的差距,但是對(duì)于圖個(gè)新鮮的網(wǎng)友們來(lái)說已經(jīng)足夠。

● “泳池派對(duì)的黑客”(cr:weirddalle)

● “當(dāng)黑武士遇見pingu”(cr:weirddalle)

● “腹語(yǔ)人偶版扎克伯格”(cr:weirddalle)

對(duì)于更“資深”一點(diǎn)的玩家來(lái)說,AI繪畫工具早已是任君挑選。除了DALL·E 2,如今受到關(guān)注的AI工具還包括:Disco Diffusion、Midjourney、NightCafe、wombo、CogView等等。

這些工具使用起來(lái)難易程度不一,比如CogView是國(guó)內(nèi)團(tuán)隊(duì)開發(fā)的AI工具,僅支持中文搜索。而Disco Diffusion充滿代碼的界面略為趕客,需要跟著教程一步步操作。

我們也玩了一把!

在AI繪圖app“dream by wombo”(可免費(fèi)下載)上,我們?cè)囍浴皏oicer”為關(guān)鍵詞,分別生成了“吉卜力”“蒸汽朋克”“浮世繪”“達(dá)利”風(fēng)格的圖片。

● 你最中意哪個(gè)?

當(dāng)然最終效果也大多與AI工具的操作難易程度成正比。CogView生成的圖片多少帶點(diǎn)AI痕跡,而Disco Diffusion的玩家社區(qū),早已成為浪漫想象力與美術(shù)功底的競(jìng)技場(chǎng)。

這些原本就是高超畫手的用戶們,與Disco Diffusion不斷磨合調(diào)教,創(chuàng)作出無(wú)數(shù)難以辨別AI繪畫痕跡的優(yōu)秀作品。

● “Father Time”(cr:@noah__proctor)

● 比起DALL·E 2,Disco Diffusion似乎更擅長(zhǎng)描繪恢弘的場(chǎng)景(cr:@discodiffusion)

● Disco Diffusion社區(qū)用戶總結(jié)了在同一描述下,各個(gè)畫家的關(guān)鍵詞會(huì)生成的不同風(fēng)格,截圖為其中一部分

雖然2022被成為“AI繪畫元年”,但“AI繪畫”絕非一個(gè)全新概念。

只是在這項(xiàng)技術(shù)發(fā)展早期,人們對(duì)此態(tài)度并不樂觀。而當(dāng)時(shí)算法也還沒有那么強(qiáng)大,AI的作品停留在學(xué)齡前兒童水平。

● 即便是現(xiàn)在,DALL·E 2還是會(huì)生成兩個(gè)手掌長(zhǎng)在一起這樣視覺錯(cuò)亂的圖片

不過人們對(duì)于AI作畫的探索并未就此停止,反而奮勇向前。在互聯(lián)網(wǎng)流行AI作畫之前,實(shí)體AI作畫就已經(jīng)受到不小的關(guān)注。

根據(jù)2018年的報(bào)道,當(dāng)年國(guó)際機(jī)器人藝術(shù)大賽的獲獎(jiǎng)名單里有不少對(duì)AI作畫的實(shí)驗(yàn)。

加拿大藝術(shù)家Joanne Hastie制作了由編程控制繪畫的機(jī)械臂;美國(guó)藝術(shù)家Pindar Van Arman創(chuàng)造的AI機(jī)器人,可以模仿所給圖片繪畫;泰國(guó)機(jī)器人實(shí)驗(yàn)室CMIT Robotics則可以捕捉人類在繪畫時(shí)的每一個(gè)動(dòng)作軌跡,機(jī)器人通過精準(zhǔn)復(fù)制動(dòng)作,從而完整復(fù)刻人類的畫作。

● Joanne Hastie創(chuàng)造的抽象作品

● 只要人類先畫一遍,CMIT Robotics就能近乎完美地復(fù)刻

● Van Arman的AI機(jī)器人可以根據(jù)動(dòng)態(tài)熱力圖來(lái)調(diào)整作畫

而在四年后的今天,AI機(jī)器人作畫顯然又向前邁進(jìn)一大步。在今年威尼斯雙年展上亮相的AI藝術(shù)家“Ai-Da”,是一個(gè)擁有機(jī)械臂、外形酷似人類的機(jī)器人。

和街頭畫家一樣,Ai-Da用機(jī)械臂繪制人物肖像,并且配置了和人類對(duì)話的智能程序及發(fā)聲器,可以邊作畫邊與繪畫對(duì)象攀談。

● Ai-Da和她的自畫像

● Ai-Da的肖像作品

● 世界上第一幅由AI機(jī)器人繪制的英國(guó)女王肖像

天才畫手還是恐怖黑箱?

● “人們戴著VR眼鏡的中世紀(jì)畫作”,由DALL·E 2生成

當(dāng)AI繪畫的實(shí)力越來(lái)越強(qiáng)勁,問題也隨之而來(lái):它會(huì)替代傳統(tǒng)繪畫嗎?畫手們是否會(huì)面臨集體失業(yè)?

有人對(duì)此保持樂觀。畢竟雖然AI很強(qiáng)大,但本質(zhì)上還是依賴人類的原創(chuàng)。它沒有獨(dú)立創(chuàng)造某種風(fēng)格的能力,而Edward Hopper有。

● 無(wú)論美漫風(fēng)格、數(shù)字藝術(shù)風(fēng)格還是寶麗來(lái),DALL·E 2都是參照人類創(chuàng)造出的現(xiàn)有風(fēng)格

也有人對(duì)此非常悲觀。雖然高端畫師暫時(shí)還不會(huì)被取代,但是普通畫手的創(chuàng)作卻可能變得越來(lái)越不值錢。

此外,AI繪圖還面臨著更多問題。

一個(gè)月前,DALL·E 2發(fā)布了一張AI圖片,描述語(yǔ)為“一個(gè)男人舉起雙臂和雙手,用手勢(shì)表示‘這么多’”。

● DALL·E 2生成結(jié)果

這張生成圖片里的男子,有點(diǎn)像每年蘋果發(fā)布會(huì)上的喬布斯,立刻引發(fā)了網(wǎng)友不滿:為什么“一個(gè)男人”=“年輕的白人男性”?難道AI世界也奉行白人中心主義嗎?

但是考慮到DALL·E 2的運(yùn)行邏輯,它也許只是這個(gè)充滿偏見的世界的縮影。

它的學(xué)習(xí)素材都來(lái)自人類的圖片——如果人類的圖片世界本身就充滿偏見和刻板印象,又怎么期待AI能根據(jù)“A man”的描述語(yǔ)生成黃種人或黑人?或者根據(jù)“護(hù)士”的描述語(yǔ),生成男女比例對(duì)等的圖片?

● DALL·E 2生成的“建筑工人”圖片

● DALL·E 2生成的“空乘人員”圖片

更嚴(yán)重的問題可能來(lái)自法律糾紛。

AI繪圖是否會(huì)重蹈AI換臉技術(shù)的覆轍,被用來(lái)做一些侵犯他人權(quán)利的事情?如果AI能夠隨意生成他人的照片,那么狗仔們是否從此有了造謠利器,而政客們也有了陷害對(duì)手的把柄?

(亞利桑那州立大學(xué)計(jì)算機(jī)技術(shù)教授)

圖片版權(quán)是一個(gè)更難厘清的問題。關(guān)于AI生成圖片能否商用,各平臺(tái)眾口紛紜。通過學(xué)習(xí)他人畫作生成的作品,是否會(huì)侵犯到原作者權(quán)益?這給知識(shí)產(chǎn)權(quán)領(lǐng)域提出了新的思考。

如果AI繪圖有一天完全成為大眾工具,那么現(xiàn)實(shí)與虛擬的邊界無(wú)疑將被進(jìn)一步模糊。

● 網(wǎng)友Aditya Ramesh使用DALL·E 2將維多利亞式房屋改造成現(xiàn)代房屋,把特斯拉變成老爺車,把iPhone變成老式電話

200年前攝影技術(shù)誕生時(shí),給繪畫帶來(lái)的最大沖擊即是“真實(shí)感”——我們可以不相信繪畫,卻不能不相信一張真實(shí)的照片。然而200年后蓄勢(shì)待發(fā)的AI繪圖技術(shù)反其道而行之,進(jìn)一步消解了圖像的真實(shí)性。

等到AI繪圖真的占領(lǐng)互聯(lián)網(wǎng)的那一天,我們還能相信眼睛看到的任何一張圖片嗎?

原標(biāo)題:《AI繪圖到底是天才畫手,還是潘多拉魔盒?》

閱讀原文

    本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問http://renzheng.thepaper.cn。

            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2025 上海東方報(bào)業(yè)有限公司

            反饋
            速博国际娱乐| 皇冠网小说推荐| 飞七棋牌游戏下载| 葡京线上娱乐| 百家乐官网送錢平臺| 网上百家乐官网解密| 百家乐十佳投庄闲法| 明珠百家乐的玩法技巧和规则 | 戰神国际娱乐城| 网上百家乐官网怎么赌能赢钱| 百家乐官网9点直赢| 在线百家乐官网大家赢| 百家乐官网轮盘技巧| 扑克王百家乐官网的玩法技巧和规则| 百家乐官网走势图备用网站| 百家乐官网波音平台路单| 百家乐官网赌博论坛博客| 庄闲和百家乐官网桌布| 游戏机百家乐庄闲| 百家乐网上赌场| 百家乐园百乐彩| 百家乐官网娱乐网真钱游戏| 百家乐出千方法技巧| bet365网址器| 巴黎百家乐官网地址| 做生意招财小窍门| 巨星百家乐的玩法技巧和规则| 百家乐官网游戏| 百家乐的桌布| 百家乐注册| 百家乐官网看| KK百家乐的玩法技巧和规则| 德阳市| 赌场百家乐官网实战| 百家乐| 手机bet365| 钱隆百家乐官网的玩法技巧和规则| 金博士百家乐官网的玩法技巧和规则 | 大赢家娱乐场| 试玩百家乐官网的玩法技巧和规则 | 大发8888备用网址|