人工智慧讓夢露開口唱歌  

     瑪麗蓮夢露死的時候,卡拉OK和數字動畫還沒發明出來,今天的當紅女歌星Dido還沒有出世。但在一段詭異的MTV中,夢露卻高唱著Dido的成名曲《獵人》(Hunter)。原來這是麻省理工學院(MIT)的研究者玩的一個花招。MIT 研究小組將人工智慧技術加入錄影製作,讓膠片上的人做出配合各種語言聲音的口型,經過他們的加工後,任何人在錄影上都可説一口流利的爪哇語,誰也找不出破綻。

    博士後Tony F. Ezzat説:“我們決定用一個已經不在人世的名人做實驗,夥計們最後挑了瑪麗蓮夢露。出來的效果相當令人激動,當然又有點詭異。”

    這一技術不但可以混淆時空,更是惡作劇的理想工具。數字技術早已可以令影像角色錯位,現在又加上了聲音效果。

    MIT小組的負責人Tomaso Poggio是麻省理工學院人工智慧實驗室的教授。上世紀90年代時,他開始用卡通做實驗。後來他又賦予可從不同角度觀看的三維臉部圖像多種表情。

    現在,Poggio 和Ezzat編制了一個電腦程式,它可以通過閱讀錄影片段,在幾天之內總結出一個人的説話模式。

    在電腦掌握一個人發每個音素時對應的嘴形後,它就可以在幾分種之內根據聲音文件修整錄影中人物的口型,最後好像這些聲音真是從這個人嘴裏發出的。

    這一技術與現有臉部動畫技術有根本性的區別:這裡的電腦有自己“學習”的能力。(BUZZ)

    應用前景

    Tomaso Poggio和他的同事製作出的電腦模擬嘴部運動完全能夠以假亂真。除了讓夢露高唱Dido的歌,讓ABC播音員説西班牙語之外,這一技術有著更廣泛的應用前景:語言訓練、幫助聾人學習説話,或者創造更加鮮活的虛擬人物。當然它肯定將大大方便未來的配音工作,配音演員不用再辛苦地對嘴形。

    《南方都市報》 2002年7月4日









版權所有 中國網際網路新聞中心 電子郵件: webmaster @ china.org.cn 電話: 86-10-68326688