網站無障礙
站內搜索

AI藝術的前世今生

發佈時間:2023-04-06 09:52:38 | 來源:光明網-《光明日報》 | 作者:馬立新 | 責任編輯:秦金月

作者:馬立新(山東師範大學美術學院教授,數字藝術哲學研究中心主任,博士生導師)

最近,全球颳起一股強勁的AI藝術風潮。究竟什麼是AI藝術?它是如何來到這個世界的?又面臨著怎樣的機遇與挑戰?

1、AI藝術關鍵詞

AI藝術是指借助於人工智慧技術(artificial intelligence,簡稱AI)生成的藝術作品。它的範圍很廣,包括AI自主生成的作品和人機合作創作的作品,這些作品目前已經涵蓋繪畫、音樂、詩歌、電影、舞蹈、雕塑等領域。要了解這種新興、新型的數字藝術,首先需要了解機器學習、演算法、神經網路、深度學習、生成對抗網路和創新對抗網路這幾個重要概念。

人類借助於感官和經驗來獲取知識,而機器學習是指電腦系統學習勝任某一專門任務的路徑:一種是通過與具體任務完成情況相關的獎懲機制來實現,這種機制稱為強化學習;一種是通過飼餵大量標記數據,首先掌握其中的邏輯,進而實現對相關資訊或事物的再現,這種機制稱為監護學習。例如飼喂一組猴子圖像讓電腦學習識別猴子,當我們將一張照片放在它前面的時候,電腦能精確地判斷這張照片是否與猴子有關。

演算法即一個按步驟執行的指令序列。它可以簡單到幾行代碼,也可能複雜得像一個百度搜索結果那樣,需要上百萬行才能顯示完全。這些指令告訴電腦做什麼,如何解決問題,怎樣運算,如何在螢幕上展示事物等。

神經元是傳遞和處理感覺資訊的人腦細胞。神經網路則是特指一種電腦演算法,它模倣人腦方式處理各種資訊,包括多層互相聯結的神經元。神經網路演算法不同於常規電腦編程演算法,後者是編程者設計好的一系列供電腦執行的程式,而前者則是一種電腦自我決策的運算機制,它不需要人類的任何指令。如卷積神經網路就是一種能夠自主識別圖像上的某一特徵或模式的神經網路。

深度學習指的是包含多層聯結神經元的神經網路。它就像人腦一樣,包含的神經元層級越多,學習能力就越強。

生成對抗網路(GAN)指兩個神經網路通過互相競爭,逐步實現一個可預期的結果,其中一個神經網路試圖生成與訓練數據不一樣的結果(通常被稱為創造神經網路),比如一張不同於訓練圖像的新照片;另一個神經網路負責識別創造神經網路生成的與訓練數據差異很大的結果(通常被稱為識別神經網路),比如創造神經網路預期是生成一張關於狗的新照片,如果輸出了一張貌似房子的圖像,識別神經網路就將其篩選出來,並反饋給創造神經網路,從而確保其朝著預期的創作目標前進。

創新對抗網路(CAN)以生成對抗網路為基本框架,但將一定的隨機性嵌入到創造神經網路的結果中,再對這些結果加入適當的美學判斷訓練機制,以期生成更為新穎和震撼的藝術作品。這顯然是模倣人類創造性的一種方式,目的是生成突破現有藝術風格和模式的藝術作品。

2、從貝葉斯推理到AI藝術

當我們談論AI藝術淵藪的時候,就必須首先從AI的歷史談起。AI發生的先決條件是獲得學習和決策的能力,特別是在資訊不充分的情況下做出決策的能力。為此,托馬斯·貝葉斯于1763年開發了一個使用算數方法推算事物發生概率的框架,這就是著名的貝葉斯推理,它成為機器學習的基本邏輯,這是AI藝術進程中最早的一塊里程碑。

1842年,數學家阿達·洛夫萊斯發表了第一個可執行的演算法。洛夫萊斯演算法預見到電腦除了運算,還能解決其他複雜的問題,這是一個革命性的預見。百年之後,即1942年,圖靈為智慧機器的創造設計了測試指標,即著名的圖靈測驗,這是一種劃時代的思想。1943年,麥卡洛克和皮茨聯合發表了《人類神經活動中意識的邏輯運算》,為電腦模倣人腦構建神經網路和深度學習鋪平了道路。1950年,科幻作家艾薩克·阿西莫夫創作了關於智慧機器的一系列短篇小説,提出了著名的機器人三定律,他的這些頗具前瞻性的思想激發了整整一代機器人學家。在1956年的達特茅斯大學夏季會議上,約翰·麥卡錫正式構建了“人工智慧(AI)”概念。當時關於AI編程機制存在兩條路徑:一條是自上而下的,即用控制人類行為的規則預先為電腦編程;另一條主張自下而上,即模倣人類神經網路機制。麥卡錫和資深電腦學家明斯基傾向於前者,並略佔上風。1959年,阿瑟·塞繆爾提出了“機器學習”的概念,根據這一概念,他預測一個會學習的跳棋機器人有可能戰勝它的編程者,這一預言被後來的超級電腦“深藍”戰勝西洋棋冠軍卡斯帕羅夫所證實。

對於AI藝術來説,1973年值得永遠銘記。這一年,加州大學教授兼畫家哈羅德·科恩在威尼斯雙年展上展示他與自己的電腦程式“艾倫”(AARON)合作創作的一幅繪畫,這標誌著AI藝術的正式誕生。

鋻於AI研發進展緩慢,羅德尼·布魯克斯認為很可能過去採用的自上而下的研發路徑是錯誤的,他受到人類神經科學進展的啟發,1990年發表了著名論文《大象不下棋》,認為視覺功能並不需要中央神經系統控制。他的這一構想也將一度不被看好的神經網路推向前臺,並極大地推動了包括AI藝術在內的各個人工智慧領域的進展。

2008年9月,一款語音識別APP出現在蘋果手機上,它的語音識別正確率達到了92%以上,這是AI藝術發展中所取得的另一個里程碑式的躍進,它為多模態大語言模型機器人的研發創造了條件。當學界和業界都在熱衷於開發優質演算法的時候,在AI領域嶄露頭角的華人科學家李飛飛清醒地認識到,再好的演算法如果沒有大量真實數據的支撐都不可能做出準確的決策,於是她提出了一個史無前例的想法——構建圖像數據庫,將整個世界都復現出來。她將自己領銜開發的這個開源性質的巨型圖像數據庫定義為ImageNet。自此以後,這個數據庫成為一線AI科學家競相檢驗演算法精度的平臺,它極大地加速了AI藝術的發展。

在2010年上海世界博覽會上,一款跳舞機器人出現在人們的視野中,其翩翩舞姿引起眾人駐足觀看。2013年,英國金斯密斯學院教授西蒙·科爾頓開發了一款名為“傻子畫師”的繪畫程式,該程式能夠從報紙上自主提取關鍵詞,並生成與該關鍵詞相關的圖像,顯現出超越圖靈測驗的創造性、靈巧性和想像力。2014年,即圖靈測驗發表72年之後,聊天機器人“尤金·古茨曼”最終通過了所有測試。2015年1月,莫德文采夫的藝術創作機器人“深夢”正式上線,自此之後,“深夢”成為很多AI藝術家放飛藝術想像的絕佳平臺。波普藝術家泰琳·薩頓上線“深夢”,于2017年創作了首張AI音樂專輯《我是AI》。一年之後,法國著名的藝術家三人聯盟機構“Obvious”利用神經網路演算法生成的藝術作品《埃德蒙德·貝拉米肖像》高價拍賣成功,創造了AI藝術的新紀元。

3、AI藝術家先驅及其創作主題

數字技術的快速發展不僅深刻地塑造著當下的經濟業態,也推動數字藝術從奇觀美學和互動美學時代迭代進入到AI美學新時代,並催生出一批在AI藝術領域勇於探索和創新的藝術家。

馬利奧·克林格曼就是活躍在這一領域的一位先驅人物。克林格曼于1970年出生於德國慕尼黑。他沒有任何藝術和電腦科學學術背景,但他天生就對電腦和藝術感興趣。13歲的時候,他有了第一台電腦,自此開始,他無師自通,迷上了編程。高中畢業後,他進入了廣告行業。1991到1992年期間,克林格曼獲得一個到總部在倫敦的廣告公司實習的機會,在那裏,他第一次接觸到蘋果電腦和專業繪圖軟體Photoshop3.0,一個成為AI藝術家的夢想由此誕生了。2004年,他使用JAVA語言編程創作了《垛狀模糊》。這是他最早的“電腦生成藝術”。2010年他編寫了一款名為“蜘蛛絲畫板”的小程式,並試著用它創作了一幅同名繪畫。讓他始料未及的是這個小程式竟然迅速獲得了一大批擁躉。從2014年年底開始,他對各種演算法、數據可視化處理和機器學習技術開展了廣泛的探索,創作了多幅極富創意的作品。2017年以來,他又將最新的生成對抗網路引入到自己的藝術實踐中,創作了大量以人臉和肖像為標誌性形象的AI藝術作品。“當你面對一個人的面部的時候,能夠解讀出極其豐富的資訊。”他對於人性的這種獨特理解成為他AI作品的一個核心主題,而人臉也成為他開展藝術實踐的肥沃土壤。

在將AI技術與舞蹈藝術融合方面,韋恩·麥克格雷格是一位始終走在前列的舞蹈家。他的《實時檔案》項目利用AI模型復現了他長達25年之久的舞蹈作品,借此在舞者和他的作品之間建構了一個現場對話。AI模型對麥克格雷格的舞蹈風格,從精緻的細微動作到複雜的移位動作都能精準捕捉到。舞者能夠從中獲得靈感,受到啟發,從而創造出新的舞蹈動作。這正是麥克格雷格對AI技術最感興趣的一點,他認為持續地創造新穎別致的動作是舞蹈藝術的靈魂,而AI技術能夠幫助他實現這個目標。

莎拉·梅約哈斯是一位橫跨電影、攝影、虛擬現實、表演和雕塑等多個學科領域的AI藝術家。她最引人矚目的AI藝術作品是《雲朵》。為呈現這一作品,她在貝爾實驗室原址上主辦了一場大型表演。16個攝影師拍攝了多達10萬張不同角度的玫瑰花瓣照片,構成了一個大型數據庫。這些資訊旨在構建一個AI演算法,用於生成獨樹一幟的花瓣圖像。《雲朵》的策展成為一次思考後人類現實和未來人類勞動處境的絕佳機會。梅約哈斯以AI技術為武器,以藝術策展為媒介,將AI藝術探索與人類所面臨的重大現實主題緊密結合,引起了業界和學界的廣泛關注。

羅比·巴拉特是一顆正在AI藝術領域冉冉升起的新星,也是一位AI藝術奇才。他只有19歲,卻以自己對於神經網路的深刻理解與創造性應用,開拓了AI藝術和傳統藝術的視野。他與法國畫家羅南·巴羅特和加萊裏·沃森三人(即上文提及的著名法國三人藝術聯盟Obvious)共同創作的頗具印象主義風格的《埃德蒙德·貝拉米肖像》,創造了43.25萬美元的拍賣高價,此舉也將AI藝術推向世界舞臺。這一系列頗具創意的AI藝術探索也讓這位年輕人步入資深AI藝術家的行列。

在當下AI藝術創作領域,湯姆·懷特以其對於人工智慧和機器感知的深度研究和廣泛探索而聞名。他的一系列AI藝術實驗都聚焦于機器凝視問題上——AI是如何觀察、如何理解和如何表達外部世界的?隨著機器感知越來越多地滲入我們的日常生活之中,這個新世界正在變成我們不得不面對的一個主導領域,懷特正是用他的AI作品來透視和反思這種現象的。為此,他創作了大量抽象作品,AI能夠對這些作品做出正確的分類。然後,他再賦予演算法如同我們一樣的自然語言能力,如此一來,我們就能夠知道AI所理解的世界。懷特的這些探索深化了我們對於AI世界的理解。

4、AI的自主創作

AI藝術在發展中最常遭遇的一個挑戰就是,如何從其生成的巨量作品中挑選出相對而言最有趣味的作品,並將其引向普通社會大眾。對於幾乎所有AI藝術家來説,策展成為他們應對這一挑戰的關鍵一招。

AI藝術家也時常陷入這樣的兩難選擇:作為藝術家的他,總是不自覺地遵從自己的口味來選擇作品,而作為策展人的他,又總要考慮盡可能向觀眾展示AI藝術的全貌。究竟應該如何協調這種兩難關係?一般來説,作為一個策展人,他的理想是把他的AI模型放在現場,讓它持續地生成圖像,並訓練這臺AI模型自己做出選擇;一旦AI模型從中做出了選擇,它就會自動消失。如此一來,這臺AI模型本身就是藝術作品,而其中選出的那些圖像不過是它所創造的一些稍縱即逝的視覺印象。不過,現在的策展還不允許一個藝術家如此超然,因為就目前的AI模型來看,如果只將它放在展覽現場,那麼觀眾所面對的大多是噪聲,而且在此情況下生成的圖像大部分都是無趣的。

現實是殘酷的。如果AI藝術能夠繁榮發展,它就必須走向大眾。因此,在高雅與通俗之間保持一定的平衡就是AI藝術的不二選擇,既不能離世俗太遠,也不能離它太近。這是大多數AI藝術家的看法。

基於深度學習的AI能否最終實現完全意義上的自主創作?這是當下所有關注AI藝術的人普遍關心的問題。比如,對於上文提及的賦予AI模型一定的策展能力和對作品的自我選擇能力,這難道不是某種AI自主性或主體性的彰顯嗎?很多活躍在AI藝術一線的藝術家都在試圖通過自身的藝術實踐來回應這個問題。克林格曼認為,這個問題從某種程度上可以從人類的傳宗接代邏輯來理解。我們生孩子是保障人類自身的繁衍和不朽。我們賦予AI一定的策展和選擇功能,本質上也可以視為一種確保人類不朽的方式。例如,我們無法將自己上傳到電腦上,但我們可以創造某種事物,讓它能夠持續生産我們想要的某種東西,哪怕我們已經離世也不受影響。某種意義上,賦能AI模型一定的策展能力就是一種讓藝術家持續延長藝術生命的方式。

另一方面,通過賦予AI一定的策展和選擇能力,我們可以看看它究竟能夠做些什麼,又是如何去做的。從AI自身的角度看,它或許會因為這些能力而獲得一定的獨立性和自主性。克林格曼于2018年創作的AI藝術《靈魂出竅》,就顯現出一抹自主性的陽光。在該程式中,他引入了一個神經脈衝機制,它可以通過隨機改變、刪除或交換被訓練的生成對抗網路的成分,而引起神經網路對於輸入資訊的誤讀,並因為這種誤讀而創造出某種富有新意的藝術形象。

另一個頗受爭議的問題是,AI能否對自己的藝術作品做出評價?大多數AI藝術家都對此持樂觀態度。從純粹技術角度看,AI總會在某一天達到自我改進和提升算力、自我評價作品品質的程度,但這也同時意味著,它將駛入一個我們再也看不到的區域;它可以理解宇宙,也可以創作一個屬於自己的宇宙,但它也必須創造某種方式讓人類理解它的這些行為。當然,它或許也會在某一天,因為我們跟不上它的速度,而最終對我們失去興趣,但至少目前還不可能發生這些情況。為解決這些問題,AI科學家們正在研發某種人腦與機器直接聯結的界面或機制,以實現對AI理解的理解。

總的來説,活躍在AI創作一線的藝術家都對AI藝術的未來充滿信心。他們堅信,隨著人工智慧、深度學習、電腦算力演算法和數據分析技術的快速發展,特別是隨著多模態大語言模型的突破性進展,在不久的將來,AI藝術家能夠創作出較之人類藝術家更有趣的藝術作品。而對於AI算力的快速提升可能引發的某些安全風險,我們也應提前做好各種應對準備。

《光明日報》( 2023年04月06日 13版)

最新播報查看更多
載入更多新聞
友情連結

關於我們  合作推廣  聯繫電話:18901119810   010-88824959   詹先生   電子郵箱:zht@china.org.cn

版權所有 中國網際網路新聞中心 京ICP證 040089號-1  網際網路新聞資訊服務許可證   10120170004號 網路傳播視聽節目許可證號:0105123