科技日報北京8月19日電 (記者劉園園)人工智慧鑒黃技術正從傳統的圖片、視頻、文字,趟進語音鑒黃這片藍海。記者19日獲悉,阿裏AI語音反垃圾服務上線公測,它可以通過聲紋識別技術,識別語音中存在的涉黃、廣告等違規資訊。

這項服務不僅可以識別中文、日文、英文、俄文等多國語言,還可以識別湖南、湖北、河南、東北、四川、廣東等地方言。

在日常生活中,阿裏AI語音鑒黃服務支援離線文件和實時語音流。阿裏安全部技術人員介紹,對那些有語義的內容,系統先將語音識別轉成文字,然後再將這些文字跟文本反垃圾模型或關鍵詞庫比對,判斷是否涉黃。對那些無語義的聲音,通過聲紋也能識別出來。

當然,識別多國語言和多地方言的能力,需要進行訓練學習。“可以把它想像成一個機器人,像一個小孩,需要不斷的餵養、訓練、學習,它才具備這樣的能力。”阿裏安全部技術人員介紹,比如廣東話,可以用一些粵語電視劇來訓練學習。

今年6月,全國掃黃打非辦通報,多個網路平臺上存在以ASMR(即自發性知覺經絡反應,主要産品為聲音內容,用於放鬆、助眠)形式傳播低俗甚至淫穢色情的問題。解決類似這種社會問題,人工智慧語音鑒黃技術未來大有可為。

 

責任編輯:宏旭