最新原創 專題 新經濟 曝光臺 中國訪談 中國三分鐘 沖浪特殊資産 潮評社 溫州 紹興 衢州 淳安 岱山 桐廬 文娛 元宇宙
您的位置:首頁 > 要聞 新聞詳情
重磅 | 南棲仙策發佈強化學習工業決策軟體REVIVE 1.0
發佈時間 | 2024-04-08 14:18:06    

導讀:在工業場景中,有很多需要做決策的任務,比如工業機器人控制、物流交通調度、化工生産和能源管理等。在這些決策場景中,好的控制策略可以幫助我們優化工業生産效率、減少錯誤,降低成本,推動工業向智慧化和可持續發展方向邁進。當前以深度強化學習為代表的智慧決策技術已經能夠在圍棋,遊戲等場景中戰勝一流的人類專家。然而,強化學習技術在實際工業環境中面臨著一些挑戰,如時間慢、成本高和安全性問題。

為了解決上述問題,南棲仙策開發了一款基於數據驅動的強化學習工具包REVIVE。這是一款面向工業場景中的決策任務的軟體,旨在幫助企業優化工業生産效率、減少錯誤,降低成本,推動工業向智慧化和可持續發展方向邁進。

自2021年正式對外發佈0.5版本以來,REVIVE已經完成了0.6-0.9版本的更新,每次更新都會帶來新的特性,使得REVIVE的效果更好,使用起來更方便。今天為大家帶來的是REVIVE的最新版本:REVIVE 1.0

REVIVE 1.0通過演算法調優升級,使得訓練得到的演算法更好更穩定,同時整合了豐富的內置函數和自定義模組,使用起來更加靈活方便,通過代碼優化和資源並行加速使得模型訓練更快。

現代工業系統通常涉及多個生産過程,包括原材料處理、加工、裝配和包裝等。這些系統通常包括多個層次和子系統,涉及各種不同的工藝、設備和控制系統。複雜的系統具有大量的輸入和輸出變數,而且這些變數之間的關係可能相互交織、不明確或非線性,這給決策任務的建模和優化帶來了非常大挑戰。

所以REVIVE 1.0增加了注意力機制的Backbone,這一機制使得在缺乏專家知識的情況下,模型也能夠通過調整注意力權重自適應的捕捉數據之間的關係,實現對複雜工藝控制和系統的有效建模。

此外,針對時延問題,REVIVE 1.0也對原有的RNN Backbone進行了優化,模型能夠更高效地提取和傳遞時序資訊,顯著提升在管網控制、化工過程等長流程和大時滯任務場景上的性能。

同時,REVIVE 1.0增加了神經網路干擾器單模組,通過多個神經網路干擾器對訓練得到的環境模型進行擾動,增強環境模型的多樣性,提升策略適應不同工況的泛化性能。

我們相信,REVIVE 1.0將為工業企業提供一種全新的決策方式,幫助企業在工業生産中實現智慧化升級。

(推廣)

來源:信陽日報    | 撰稿:REVIVE    | 責編:谷晟    審核:張淵

新聞投稿:184042016@qq.com    新聞熱線:135 8189 2583