分享到:
連結已複製
首頁> 一帶一路網> 科技創新>

多尺度神經可塑性調製機制啟發的類腦連續學習

2023-08-30 09:07

來源:中國網·中國發展門戶網

分享到:
連結已複製
字體:

中國網/中國發展門戶網訊 中國科學院自動化研究所徐波研究員團隊聯合中國科學院腦科學與智慧技術卓越創新中心蒲慕明院士、臨港實驗室李澄宇研究員等,通過建模多巴胺、乙酰膽鹼等全局神經調製可塑性(Neuromodulation Plasticity)、局部時序依賴可塑性(Spike Timing-Dependent Plasticity, STDP)等多尺度神經可塑性機制,整合得到一種基於神經調製依賴可塑性的新型類腦學習方法(Neuromodulation-Assisted Credit Assignment,NACA)。該方法參考了大腦中複雜的神經調製通路結構,並以期望矩陣編碼的形式對神經調製通路構建數學模型,在接受刺激信號後産生不同濃度的多巴胺監督信號並進一步影響局部突觸和神經元可塑性類型。NACA支援採用純前饋的流式學習方法訓練脈衝(Spiking Neural Network, SNN)和人工(Artificial Neural Network, ANN)神經網路,通過全局多巴胺的彌散支援與輸入信號同步,甚至先於輸入信號的正向資訊傳播,再加上選擇性的對STDP的調整,使得NACA表現出明顯的快速收斂和緩解災難性遺忘優勢。該研究論文以A brain-inspired algorithm that mitigates catastrophic forgetting of artificial and spiking neural networks with low computational cost為題已線上發表于《科學》旗下期刊《科學進展》(Science Advances)。

image.png

NACA計算模型。(A)神經調製通路建模和群體期望編碼。(B)多類局部可塑性。(C-E)NACA演算法整體流程及在SNN和ANN中發揮作用

人工智慧迫切需要借鑒生物系統中的微觀、介觀、宏觀等多尺度神經可塑性融合電腦制,以便啟發實現更加高效的類腦連續學習演算法,消除人工神經網路由於採用反向傳播(Backpropagation, BP)等人工學習方法而導致的廣泛災難性遺忘現象。生物系統中常見的多巴胺、5-羥色胺、血清素、去甲腎上腺素等神經調質物,往往經由特定的腺體釋放,並遠端彌散、投射到一定範圍內的目標神經元群體,且根據調質濃度水準的不同,對局部的神經元、突觸等多種微觀可塑性産生複雜的調製影響。

image.png

大腦中的神經調製。(A)四種神經調質及其通路。(B)非線性神經調製。(C)神經調製多樣化局部可塑性

據介紹,在兩類典型的圖片和語音模式識別任務中,研究團隊從準確率和計算成本兩方面對NACA演算法進行了評估,並在SNN中選取了E-prop 和BRP 兩種全局學習演算法作為對比,在ANN中則以TP(Target Propagation)和BP演算法作為對比對象。在圖片分類(MNIST)和語音識別(TIDigits)標準數據集上,NACA都實現了更高的分類精度(約1.92%)和更低學習能耗(約98%)。在驗證了靜態分類任務的擬合能力後,研究團隊重點測試NACA演算法在Class-CL上的連續學習能力,並將神經調製擴充到神經元可塑性範圍。在五大類的連續學習任務中(包括連續MNIST手寫數字、連續Alphabet手寫字母、連續MathGreek手寫數學符號、連續Cifar-10自然圖片、連續DvsGesture動態手勢),NACA演算法相對BP和EWC演算法,具有更低的能耗且發現可以極大地緩解災難性遺忘問題。

image.png

NACA演算法在Class-CL任務中的表現。(A,B)神經調製同時影響局部神經元和突觸可塑性。(C-G)NACA與EWC、BP等性能對比

研究人員認為,NACA是一類生物合理的全局優化演算法,這種採用宏觀可塑性來進一步“調製”局部可塑性,可以視為一種“可塑性的可塑性”(Plasticity of Plasticity)方法,與“學會學習”、“元學習”(Learn to Learn)等有直觀上的功能一致性。該演算法同時在SNN和ANN的優化問題中獲得了性能和計算成本上的優勢,更在連續學習這一更貼合生物生存環境和實際應用場景的動態任務範式下發揮重要作用,這些純前饋學習、低訓練能耗、支援動態連續學習等綜合特徵,也將有望進一步引導新型類腦晶片的設計。

中國科學院自動化研究所張鐵林副研究員為第一作者,徐波研究員為通訊作者,程翔、賈順程、中國科學院腦智卓越中心蒲慕明院士和臨港實驗室李澄宇研究員為本文共同作者。

【責任編輯:王虔】
返回頂部