重磅 | 南棲仙策發佈強化學習工業決策軟體REVIVE 1.0-中國網

您的位置：首頁 > 要聞新聞詳情

重磅 | 南棲仙策發佈強化學習工業決策軟體REVIVE 1.0

發佈時間 | 2024-04-08 14:18:06

導讀：在工業場景中，有很多需要做決策的任務，比如工業機器人控制、物流交通調度、化工生産和能源管理等。在這些決策場景中，好的控制策略可以幫助我們優化工業生産效率、減少錯誤，降低成本，推動工業向智慧化和可持續發展方向邁進。當前以深度強化學習為代表的智慧決策技術已經能夠在圍棋，遊戲等場景中戰勝一流的人類專家。然而，強化學習技術在實際工業環境中面臨著一些挑戰，如時間慢、成本高和安全性問題。

為了解決上述問題，南棲仙策開發了一款基於數據驅動的強化學習工具包REVIVE。這是一款面向工業場景中的決策任務的軟體，旨在幫助企業優化工業生産效率、減少錯誤，降低成本，推動工業向智慧化和可持續發展方向邁進。

自2021年正式對外發佈0.5版本以來，REVIVE已經完成了0.6-0.9版本的更新，每次更新都會帶來新的特性，使得REVIVE的效果更好，使用起來更方便。今天為大家帶來的是REVIVE的最新版本：REVIVE 1.0。

REVIVE 1.0通過演算法調優升級，使得訓練得到的演算法更好更穩定，同時整合了豐富的內置函數和自定義模組，使用起來更加靈活方便，通過代碼優化和資源並行加速使得模型訓練更快。

現代工業系統通常涉及多個生産過程，包括原材料處理、加工、裝配和包裝等。這些系統通常包括多個層次和子系統，涉及各種不同的工藝、設備和控制系統。複雜的系統具有大量的輸入和輸出變數，而且這些變數之間的關係可能相互交織、不明確或非線性，這給決策任務的建模和優化帶來了非常大挑戰。

所以REVIVE 1.0增加了注意力機制的Backbone，這一機制使得在缺乏專家知識的情況下，模型也能夠通過調整注意力權重自適應的捕捉數據之間的關係，實現對複雜工藝控制和系統的有效建模。

此外，針對時延問題，REVIVE 1.0也對原有的RNN Backbone進行了優化，模型能夠更高效地提取和傳遞時序資訊，顯著提升在管網控制、化工過程等長流程和大時滯任務場景上的性能。

同時，REVIVE 1.0增加了神經網路干擾器單模組，通過多個神經網路干擾器對訓練得到的環境模型進行擾動，增強環境模型的多樣性，提升策略適應不同工況的泛化性能。

我們相信，REVIVE 1.0將為工業企業提供一種全新的決策方式，幫助企業在工業生産中實現智慧化升級。

（推廣）

來源：信陽日報 | 撰稿：REVIVE | 責編：谷晟審核：張淵

新聞投稿：184042016@qq.com 新聞熱線：135 8189 2583

原創