集美大學(xué)吳德烽獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉集美大學(xué)申請的專利一種多無人艇避碰決策方法獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN115718497B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-08-15發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202211480755.7,技術(shù)領(lǐng)域涉及:G05D1/43;該發(fā)明授權(quán)一種多無人艇避碰決策方法是由吳德烽;薛德來;劉源鑠;劉啟俊設(shè)計研發(fā)完成,并于2022-11-24向國家知識產(chǎn)權(quán)局提交的專利申請。
本一種多無人艇避碰決策方法在說明書摘要公布了:本發(fā)明涉及一種多無人艇避碰決策方法。同時考慮碰撞風(fēng)險和COLREGs,通過相互速度障礙區(qū)域表示環(huán)境信息并評估環(huán)境風(fēng)險,近端策略優(yōu)化根據(jù)評估環(huán)境風(fēng)險決策行為。使用相互速度障礙算法改進近端策略優(yōu)化算法的行動空間和獎勵函數(shù),一個基于遞歸模塊的神經(jīng)網(wǎng)絡(luò)被用來將周圍不同數(shù)量障礙物的狀態(tài)直接映射為行動,以解決有限信息下的避碰問題。本發(fā)明方法開發(fā)了一種新的基于相互速度障礙區(qū)域和預(yù)期碰撞時間的獎勵函數(shù),可以適應(yīng)許多不同的環(huán)境并解決稀疏獎勵難題。本發(fā)明結(jié)合了近端策略優(yōu)化和相互速度障礙,結(jié)合兩者的優(yōu)點,使多無人艇在COLREGs的基礎(chǔ)上完美實現(xiàn)避碰,保證了多無人艇執(zhí)行任務(wù)安全航行。
本發(fā)明授權(quán)一種多無人艇避碰決策方法在權(quán)利要求書中公布了:1.一種多無人艇避碰決策方法,其特征在于,包括如下步驟: 步驟1、構(gòu)建決策模型; 步驟2、載入未知環(huán)境,訓(xùn)練決策模型; 步驟3、設(shè)計測試環(huán)境,提取當前可監(jiān)測環(huán)境信息; 步驟4、環(huán)境感知; 步驟5、數(shù)據(jù)處理; 步驟6、風(fēng)險評估,檢查當前無人艇風(fēng)險狀態(tài); 步驟7、根據(jù)步驟6,針對風(fēng)險執(zhí)行相應(yīng)決策行為; 步驟8、根據(jù)步驟7,計算獎勵值; 步驟9、判斷是否實現(xiàn)避碰,返回獎勵值與結(jié)果; 步驟1中,決策模型采用近端策略優(yōu)化算法和相互速度障礙算法構(gòu)建;近端策略優(yōu)化算法算法首先從初始化神經(jīng)網(wǎng)絡(luò)開始,設(shè)置兩個actor網(wǎng)絡(luò),結(jié)構(gòu)為兩層,每層256個神經(jīng)元,其中網(wǎng)絡(luò)π采樣,對舊網(wǎng)絡(luò)πold更新;在訓(xùn)練循環(huán)期間,網(wǎng)絡(luò)π接收當前環(huán)境信息,根據(jù)信息選擇動作更新狀態(tài)s'并返回獎勵r;兩個actor網(wǎng)絡(luò)通過自適應(yīng)KL懲罰;critic網(wǎng)絡(luò)結(jié)構(gòu)為兩層,每層256個神經(jīng)元,通過s',r評價動作好壞,對網(wǎng)絡(luò)π更新;相互速度障礙算法是基于速度的避碰算法,將周圍信息用向量表示,通過移動速度和方向評估碰撞風(fēng)險; 步驟2中,訓(xùn)練決策模型的具體步驟如下: 步驟2.1、通過設(shè)計的未知環(huán)境,確定多無人艇當前位置以及各無人艇目標點; 步驟2.2、相互速度障礙算法評估當前碰撞風(fēng)險,并將結(jié)果反饋給近端策略優(yōu)化,網(wǎng)絡(luò)π執(zhí)行動作并更新位置狀態(tài)和動作狀態(tài),得到網(wǎng)絡(luò)參數(shù)θ'; 步驟2.3、網(wǎng)絡(luò)πold根據(jù)環(huán)境進行決策,得到網(wǎng)絡(luò)參數(shù)θ; 步驟2.4、θ與θ'通過KL散度進行θ'對θ的更新; 步驟2.5、相互速度障礙算法評估當前碰撞風(fēng)險中,若檢測到碰撞風(fēng)險,預(yù)測障礙物下一時刻的速度狀態(tài),通過障礙物下一時刻狀態(tài)改變無人艇速度大小和方向,使無人艇避開障礙物; 步驟2.6、若距離目標點越來越遠,則反饋較低獎勵值,調(diào)整無人艇運動方向向目標點靠近; 步驟2.7、若選定速度與期望速度相差很大,則反饋較低獎勵值,調(diào)整無人艇速度向期望速度靠近; 步驟2.8、判斷是否完成避碰,若完成且到達目標點,則得到基本避碰路線; 步驟2.9、若沒有完成避碰行為,則返回步驟2.1,繼續(xù)迭代更新直至到達目標點; 步驟2.10、訓(xùn)練N次,得到最優(yōu)避碰路線算法訓(xùn)練完成,得到訓(xùn)練后的決策模型; 所述步驟4具體實現(xiàn)方式為:監(jiān)測周圍環(huán)境信息,用相互速度障礙向量表示; 所述步驟5具體實現(xiàn)方式為:GRU神經(jīng)網(wǎng)絡(luò)對輸入信息處理成相同維度; 每條無人艇的傳感器需要設(shè)置最大檢測范圍,需要接收的信號為可檢測范圍內(nèi)其他無人艇的尺寸、當前速度、當前艏向和避碰半徑;在獲得局部環(huán)境的先驗信息后,實現(xiàn)局部避碰路徑規(guī)劃; 所述步驟7具體實現(xiàn)方式為:根據(jù)相互速度障礙算法評估,執(zhí)行避碰行為、正常航行或加速行為; 所述步驟8具體實現(xiàn)方式為:根據(jù)無人艇當前狀態(tài)與目標點的距離,反饋獎勵,指導(dǎo)無人艇下一時刻的決策行為。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人集美大學(xué),其通訊地址為:361021 福建省廈門市集美區(qū)銀江路185號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。