導讀:在工業場景中,有很多需要做決策的任務,比如工業機器人控制、物流交通調度、化工生産和能源管理等。在這些決策場景中,好的控制策略可以幫助我們優化工業生産效率、減少錯誤,降低成本,推動工業向智慧化和可持續發展方向邁進。當前以深度強化學習為代表的智慧決策技術已經能夠在圍棋,遊戲等場景中戰勝一流的人類專家。然而,強化學習技術在實際工業環境中面臨著一些挑戰,如時間慢、成本高和安全性問題。
為了解決上述問題,南棲仙策開發了一款基於數據驅動的強化學習工具包REVIVE。這是一款面向工業場景中的決策任務的軟體,旨在幫助企業優化工業生産效率、減少錯誤,降低成本,推動工業向智慧化和可持續發展方向邁進。
自2021年正式對外發佈0.5版本以來,REVIVE已經完成了0.6-0.9版本的更新,每次更新都會帶來新的特性,使得REVIVE的效果更好,使用起來更方便。今天為大家帶來的是REVIVE的最新版本:REVIVE 1.0。
REVIVE 1.0通過演算法調優升級,使得訓練得到的演算法更好更穩定,同時整合了豐富的內置函數和自定義模組,使用起來更加靈活方便,通過代碼優化和資源並行加速使得模型訓練更快。
現代工業系統通常涉及多個生産過程,包括原材料處理、加工、裝配和包裝等。這些系統通常包括多個層次和子系統,涉及各種不同的工藝、設備和控制系統。複雜的系統具有大量的輸入和輸出變數,而且這些變數之間的關係可能相互交織、不明確或非線性,這給決策任務的建模和優化帶來了非常大挑戰。
所以REVIVE 1.0增加了注意力機制的Backbone,這一機制使得在缺乏專家知識的情況下,模型也能夠通過調整注意力權重自適應的捕捉數據之間的關係,實現對複雜工藝控制和系統的有效建模。
此外,針對時延問題,REVIVE 1.0也對原有的RNN Backbone進行了優化,模型能夠更高效地提取和傳遞時序資訊,顯著提升在管網控制、化工過程等長流程和大時滯任務場景上的性能。
同時,REVIVE 1.0增加了神經網路干擾器單模組,通過多個神經網路干擾器對訓練得到的環境模型進行擾動,增強環境模型的多樣性,提升策略適應不同工況的泛化性能。
我們相信,REVIVE 1.0將為工業企業提供一種全新的決策方式,幫助企業在工業生産中實現智慧化升級。
(推廣)
來源:信陽日報 | 撰稿:REVIVE | 責編:谷晟 審核:張淵
新聞投稿:184042016@qq.com 新聞熱線:135 8189 2583