人工智慧讓夢露開口唱歌

瑪麗蓮夢露死的時候，卡拉ＯＫ和數字動畫還沒發明出來，今天的當紅女歌星Ｄｉｄｏ還沒有出世。但在一段詭異的ＭＴＶ中，夢露卻高唱著Ｄｉｄｏ的成名曲《獵人》（Ｈｕｎｔｅｒ）。原來這是麻省理工學院（ＭＩＴ）的研究者玩的一個花招。ＭＩＴ　研究小組將人工智慧技術加入錄影製作，讓膠片上的人做出配合各種語言聲音的口型，經過他們的加工後，任何人在錄影上都可説一口流利的爪哇語，誰也找不出破綻。

博士後Ｔｏｎｙ　Ｆ．　Ｅｚｚａｔ説：“我們決定用一個已經不在人世的名人做實驗，夥計們最後挑了瑪麗蓮夢露。出來的效果相當令人激動，當然又有點詭異。”

這一技術不但可以混淆時空，更是惡作劇的理想工具。數字技術早已可以令影像角色錯位，現在又加上了聲音效果。

ＭＩＴ小組的負責人Ｔｏｍａｓｏ　Ｐｏｇｇｉｏ是麻省理工學院人工智慧實驗室的教授。上世紀９０年代時，他開始用卡通做實驗。後來他又賦予可從不同角度觀看的三維臉部圖像多種表情。

現在，Ｐｏｇｇｉｏ　和Ｅｚｚａｔ編制了一個電腦程式，它可以通過閱讀錄影片段，在幾天之內總結出一個人的説話模式。

在電腦掌握一個人發每個音素時對應的嘴形後，它就可以在幾分種之內根據聲音文件修整錄影中人物的口型，最後好像這些聲音真是從這個人嘴裏發出的。

這一技術與現有臉部動畫技術有根本性的區別：這裡的電腦有自己“學習”的能力。（ＢＵＺＺ）

應用前景

Ｔｏｍａｓｏ　Ｐｏｇｇｉｏ和他的同事製作出的電腦模擬嘴部運動完全能夠以假亂真。除了讓夢露高唱Ｄｉｄｏ的歌，讓ＡＢＣ播音員説西班牙語之外，這一技術有著更廣泛的應用前景：語言訓練、幫助聾人學習説話，或者創造更加鮮活的虛擬人物。當然它肯定將大大方便未來的配音工作，配音演員不用再辛苦地對嘴形。

《南方都市報》 2002年7月4日