數字賦能文化|科技助力煥新

數字賦能文化|科技助力煥新

 

攜帶型AI系統可將大腦思想翻譯成語言

數字空間>

時間:  2023-12-15 10:28:40  |  來源:  科技日報

據物理學家組織網11日報道,澳大利亞雪梨科技大學科學家開發出了首款攜帶型、非侵入性的人工智慧系統,可解碼無聲的想法並將其轉化為有形的文本。這項技術可幫助那些因疾病或受傷(包括中風或癱瘓)而無法説話的人進行溝通,也有望實現人與倣生手臂或機器人等設備之間的無縫通信。最新研究代表了將原始腦電圖(EEG)直接翻譯成語言的開創性努力,標誌著該領域的一次重大突破。

DeWave模型通過從大量的腦電圖數據中學習,將腦電圖信號翻譯成單詞和句子。

圖為研究人員正在測試DeWave模型。圖片來源:雪梨科技大學

在最新研究中,參與者佩戴一頂帽子,通過EEG記錄頭皮的腦電活動,同時默讀文本段落。EEG波被分割成不同單元,從人腦中捕捉特定的特徵和模式,這一任務由研究人員開發的DeWave模型完成。DeWave模型通過從大量的腦電圖數據中學習,將腦電圖信號翻譯成單詞和句子。

研究人員指出,這是科學家首次將離散編碼技術納入大腦思想轉化為文本的翻譯過程。為此,他們引入了一種創新性的神經解碼方法。最新技術與大型語言模型的整合,也為神經科學和人工智慧開闢了新的前沿。

以前將大腦信號轉換為語言的技術要麼需要在大腦中植入電極,比如埃隆·馬斯克的Neuralink,要麼需要借助磁共振成像(MRI)設備掃描大腦,而MRI機器體積大、價格貴,難以在日常生活中使用。此外,這些方法也很難在沒有眼動追蹤輔助的情況下將大腦信號轉換為單詞級片段,因此限制了這些系統的實際應用。而最新技術既可使用眼動追蹤,也可不使用眼動追蹤。

最新研究共有29名參與者,這意味著它或許能比以前只在一兩個人身上測試過的解碼技術更強大、更具適應性,因為不同人之間的腦電波不同。

借助佩戴的帽子而非從植入大腦的電極接收EEG信號,意味著信號的噪音更多。但研究結果顯示,新系統在腦電圖翻譯方面的表現超過了之前的基準。這項研究已被選為12月12日在美國新奧爾良舉行的NeurIPS會議的重點論文,該會議旨在展示領先的人工智慧和機器學習研究成果。(記者劉霞)