南京航空航天大學吳巧云獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉南京航空航天大學申請的專利基于脈沖混合強化學習的移動機器人避障運動規劃方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120406474B 。
龍圖騰網通過國家知識產權局官網在2025-09-02發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510926612.1,技術領域涉及:G05D1/43;該發明授權基于脈沖混合強化學習的移動機器人避障運動規劃方法是由吳巧云;易程;汪俊;李祥雨;王為周設計研發完成,并于2025-07-07向國家知識產權局提交的專利申請。
本基于脈沖混合強化學習的移動機器人避障運動規劃方法在說明書摘要公布了:本發明涉及移動機器人避障運動規劃技術領域,解決了移動機器人在靈活避障運動規劃過程中面臨能耗過高,以及自主導航能力和避障性能存在不足的技術問題,尤其涉及一種基于脈沖混合強化學習的移動機器人避障運動規劃方法,通過將脈沖神經網絡的低能耗特性與強化學習的靈活決策機制相結合,使移動機器人能夠在復雜環境中自主生成最優路徑,同時有效降低計算成本和能量浪費。本發明能夠有效提升移動機器人在動態環境中的避障性能,使其在復雜多變的環境中實現安全、高效的自主導航,使移動機器人在降低能耗的同時,仍能保持優異的性能表現,從而推動智能裝備在智能制造領域的廣泛應用和實用化進程。
本發明授權基于脈沖混合強化學習的移動機器人避障運動規劃方法在權利要求書中公布了:1.一種基于脈沖混合強化學習的移動機器人避障運動規劃方法,其特征在于,該方法包括以下步驟: S1、移動機器人在任一次環境交互中,從傳感器獲取每一步場景中包括觀測值以及動作空間的觀測信息; S2、建立以觀測信息作為輸入,強化移動機器人在動態環境中對環境信息的感知,并輸出移動機器人在動態環境中規避障礙物所需執行動作指令的混合脈沖強化學習模型;所述混合脈沖強化學習模型包括: 一個群體編碼的編碼模塊,用以將觀測信息映射為多通道神經元的活動激活值,并生成固定時間步長的脈沖序列; 以脈沖序列作為輸入的脈沖神經網絡模塊,用于模擬生物神經元膜電位變化、突觸電流積累與脈沖觸發機制并輸出編碼活動; 以及,將脈沖神經網絡模塊輸出的編碼活動轉換為更直觀的動作空間表達的解碼模塊; S3、建立在移動機器人執行動作指令下用于引導移動機器人路徑規劃訓練的獎勵機制,具體過程包括: 如果移動機器人向目標移動,則按距離減小的比例給予正向獎勵,具體更新規則如下: ; 其中,表示在時間步,移動機器人到目標的歐幾里得距離; 若發現移動機器人越來越靠近障礙物時,則給予漸進的懲罰,具體公式如下: ; 其中,表示移動機器人距離障礙物的最小距離; 若移動機器人與障礙物的距離小于設定的障礙物半徑,即移動機器人與障礙物發生了碰撞,則給予懲罰并結束,即: ; 其中,、分別為移動機器人和障礙物的尺寸大小; 移動機器人與目標的距離小于目標范圍,即移動機器人成功到達目標點,則一次性給予大額獎勵并終止任務,即: ; 其中,表示目標點的范圍; 引入時間懲罰,并基于正向獎勵、懲罰、懲罰以及大額獎勵,獲得用于引導移動機器人路徑規劃訓練的總獎勵,表達式為: ; 其中,表示獎勵機制下的總獎勵; S4、對混合脈沖強化學習模型的參數進行優化,獲得用于指導移動機器人完成避障任務的最優運動路徑,具體過程包括以下步驟: S41、基于最大熵強化學習算法建立用于對混合脈沖強化學習模型的參數進行優化的深度強化學習框架,所述深度強化學習框架包括生成一個概率分布用于決定移動機器人動作的策略網絡,以及用來評估狀態-動作對價值的價值網絡; S42、以最小化策略損失和Q值損失來訓練策略網絡和價值網絡作為深度強化學習框架的訓練目標; S43、基于訓練目標,以最大化策略的期望回報,并最小化策略的熵作為優化策略損失的目標,表達式為: ; 其中,表示從經驗回放池D中隨機抽取樣本;表示熵正則化系數,用來平衡探索與利用;表示狀態和動作的值,和是價值網絡對同一狀態-動作對的兩個不同值估計; S44、基于獎勵機制計算混合脈沖強化學習模型對未來獎勵的預測,即: ; 其中,表示當前狀態和動作所獲得的獎勵;表示折扣因子,決定了未來獎勵的影響;表示當前策略下,動作在狀態下的對數概率,用于鼓勵移動機器人進行更多探索; S45、根據對未來獎勵的預測,使用雙Q網絡最小化損失函數來訓練價值網絡,即: ; 其中,表示價值網絡損失; S46、隨機初始化整個深度強化學習框架的參數,并使用Adam優化器更新各模塊的權重。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人南京航空航天大學,其通訊地址為:210016 江蘇省南京市秦淮區御道街29號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。