人工智慧修復,讓歷史“重生”
發佈時間:2020-05-25 13:10:37 | 來源:解放日報 | 作者:彭薇 | 責任編輯:張青近日,一段被人工智慧修復的100年前北京街景影像片段在網路上“刷屏”。有了AI的幫助,那些原本卡頓、清晰度差的黑白畫面被還原了色彩,1920年的北京城變得流暢而生動,頗有生活氣息。有人感嘆:時間兩頭的我們,被這段影片連了起來,好像“穿越”了一樣。百年前的影像中我們看到了什麼?AI修復,如何讓歷史“重生”?
AI再現歷史風貌
100年前的北京城和中國人,究竟是什麼模樣?
從大全景來看,百年前的北京街景,充滿了年代感。馬路上人來人往,人流、馬車、人力車交錯而行,集市、食肆、儀仗、禮儀、買賣等,就這樣呈現在我們眼前。不少網友在微網志邊看邊討論今昔的不同:“駱駝出現在大街上,是當時的運輸工具;現在要去沙漠裏尋找駱駝”“100年前出來逛街的都是男人,現在女人比較多”……
這段影像由加拿大攝影師拍攝而成,而給它重新上色修復的是中國一位年輕的獨立遊戲開發者大谷。原本色彩單調、輪廓模糊的人影,變得面目清晰、動作流暢,再加上後期逼真的音效,生動再現了當時的歷史風貌。
記者通過網路聯繫到了人在美國紐約的大谷,他説,自己一直在B站做繪畫、作曲等科普視頻,這是第一次利用人工智慧修復歷史影像。“我從小在北京長大,對老北京的風貌情有獨鍾。”大谷説,由於當年拍攝設備的限制,我們看到的黑白影像損失了重要的色彩資訊,AI可通過演算法和大量的訓練打造成“火眼金睛”,先對照片進行圖像分割,區分出標誌性物體,如樹木、天空、人臉、服裝等,對黑白影像場景進行彩色化處理。
“傳統的影像修復,是由藝術家們手繪,一幀幀影像重新上色,比較耗時費力,一段影片往往需要幾十到數百人同時奮戰幾十天。”他説,而人工智慧做的是同樣的步驟,不過運算效率更快。他截取了10分鐘視頻,一個人用了7天時間,嘗鮮使用AI技術相繼完成上色、修復幀率、擴大解析度,最終呈現出流暢的彩色畫面。
大谷同時表達了自己的遺憾。“這段影像的色彩,是AI自我學習的結果,不一定是歷史的原色。”他説,這次AI修復所採用的模型是從國外老電影中“學習”的,影片整體色彩比較淡,如果更好地了解歷史,能做得更準確。他表示人工智慧不足的地方,也要通過訓練不斷加強。他準備讓AI程式加強“學習”,多“看”一些中國年代影片,在未來進行修復著色時將更有中國味道。
年代感的看點不少
這段“重生”的歷史影像,雖然只有短短幾分鐘,卻留下了許多有年代感的看點。
一段畫面中出現了多人互相行禮的片段,細細看來,包含了三種禮儀。比如“打千禮”,這是滿族男子下對上通行的一種禮節,流行于清代。禮儀姿勢為屈左膝、垂右手、上體稍向前俯,在清宮戲中常能看到這類禮儀。第二個禮儀是“作揖”,是漢人男子之間的見面禮——兩手抱掌前推,身子略彎,表示向人敬禮。孔子像中的孔子,也是作揖的姿態。第三個是“萬福禮”,這是漢人女子的見面禮。右手放在左手上兩手握拳,位於腹部正中央,右腳向後撤一小步,兩膝微曲,頷首低眉,微微伏身而起。“萬福”二字,出自《詩經》,最早是表示祝福的吉祥語,意為福氣滿滿。比如1987年版電視劇《紅樓夢》中,林黛玉初見賈寶玉時,賈寶玉行的是作揖禮,林黛玉行的就是萬福禮。
這段影像還閃過了一個鏡頭,是見證歷史的白色牌坊“克林德碑”。當年,京城老百姓對這個名字很“硌硬”,大家都叫它“石頭牌坊”。
1900年6月2日,德國公使克林德在此處被人開槍打死,以此事件為導火索最終引發了八國聯軍侵華和簽訂《辛醜條約》。根據德國要求,1901年6月25日,清政府在克林德殞命處開工建造一座紀念牌坊並祭祀謝罪。直到1918年11月第一次世界大戰結束,德國成為戰敗國,這座象徵著屈辱的牌坊立刻成為眾矢之的,于1919年被拆除。拆除後,主體的散件被運至中央公園(今中山公園)重新組裝,題頭被換成了“公理戰勝”,在1952年召開的亞洲及太平洋區域和平會議上,為表彰中國人民保衛世界和平所做的貢獻,決定將“公理戰勝”牌改為“保衛和平”碑。
影視作品“修舊如舊”
“歷史影像一上色,好像拉近了和我們之間的距離,看完十分親切。”大谷表示,許多網友和他交流中都談到這一體會。其實,去年新中國成立70週年時,《開國大典》等經過AI和人工修復的獻禮片就驚艷了公眾,許多觀眾看後熱淚盈眶。
修復版的電影《開國大典》讓人們目睹三次戰役勝利到開國大典的歷史過程。通過人工智慧深度學習的方式,老片中常見的噪點、色偏、模糊、抖動、劃痕等“小傷小痛”得以被批量化修復。但是,一些老片畫面由於損失嚴重或存在大片污漬,人工智慧無法通過時間、空間資訊“腦補”,在這種情況下,必須依靠有經驗的修復專家來完成。因此,專業修復師對影片《開國大典》進行了修補,總共修復了1082個鏡頭。雖然修復歷時僅40天,但這是600人每天工作20小時之後的結果。可見,人工智慧實際上不能完全代替手工勞動,人機共同協作才能産生最好的結果。
為高科技裝上“指南針”
近年來,電腦視覺在人工智慧和深度學習的大背景下變得流行起來,越來越多的應用場景被挖掘,圖像處理技術成為最熱門的應用之一。而深受公眾喜愛的是圖像修復功能,一鍵修復老照片等App應用,在社交網路上掀起傳播潮流。
大谷告訴記者,AI圖像修復有許多神奇的玩法。比如人臉生成,用新婚夫婦的照片通過AI程式可以製作一張未來孩子的照片;再比如,一些人沒有童年照片,這樣的遺憾也可以通過人工智慧來彌補,AI通過對其現有照片的學習和判斷,生成童年照。“你也可以通過人工智慧看看自己變老的樣子。”他説。
許多科學家開始關注人工智慧的注意力機制。注意力機制來源於人類的視覺注意力,即人類在進化過程中形成的一種處理視覺資訊的機制。對於人工智慧來説,它是機器學習中的一種數據處理方法,主要功能是減少對無用線索的關注。
目前,AI注意力和真正的人類注意力差距仍然很大。在科學家們看來,在未經充分訓練的情況下,讓AI關注人是容易的,但關注某個特定的人是困難的。目前來説,AI注意力機制更接近直覺,科學家也在研究增加模型的知識儲備,提升模型的推理能力,這樣AI才能在複雜的圖像等語境下運用注意力完成更為複雜的操作。
人工智慧修復,為公眾呈現了一次遇見古人的時空穿梭之旅。然而,技術不僅僅是應用工具。對於創造和應用技術的人類而言,在法律規範和道德約束下讓技術“為我所用”,才能真正為技術裝上“指南針”,實現人類和科技的促進發展。(記者彭薇)