中國人民解放軍國防科技大學徐坤獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉中國人民解放軍國防科技大學申請的專利一種無人機信息收集的控制方法、設備及介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN116859719B 。
龍圖騰網通過國家知識產權局官網在2025-08-08發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202310658911.2,技術領域涉及:G05B13/04;該發明授權一種無人機信息收集的控制方法、設備及介質是由徐坤;但陽鵬;段超凡;楊帆設計研發完成,并于2023-06-05向國家知識產權局提交的專利申請。
本一種無人機信息收集的控制方法、設備及介質在說明書摘要公布了:本發明公開了一種無人機信息收集的控制方法,包括:定義連續狀態和動作空間下無人機進行信息收集的過程,將無人機對多個節點在給定時間內收集的信息的量最大化作為優化目標;將連續狀態和動作空間下有狀態估計誤差的無人機信息收集的優化目標求解轉化為穩健強化學習中的最優控制策略求解;利用基于策略梯度的穩健Actor?Critic學習算法獲取連續狀態和動作空間下有狀態估計誤差時的最優控制策略。本發明首次提出了如何處理在連續狀態和動作空間下、無人機狀態存在估計誤差且被收集信息節點信息未知的綜合情況下的信息收集自主控制問題,并將該問題轉化為穩健強化學習中的最優控制策略求解,最后利用穩健Actor?Critic學習算法進行解算,從而擴展了應用場景。
本發明授權一種無人機信息收集的控制方法、設備及介質在權利要求書中公布了:1.一種無人機信息收集的控制方法,其特征在于,包括: 定義連續狀態空間和動作空間下無人機進行信息收集的過程,將無人機對多個節點在給定時間內收集的信息的量最大化作為優化目標; 將連續狀態空間和動作空間下有狀態估計誤差的無人機信息收集的優化目標求解轉化為穩健強化學習中的最優控制策略求解; 利用基于策略梯度的穩健Actor-Critic學習算法獲取連續狀態空間和動作空間下有狀態估計誤差時的最優控制策略; 其中,所述利用基于策略梯度的穩健Actor-Critic學習算法獲取連續狀態空間和動作空間下有狀態估計誤差時的最優控制策略包括: 通過穩健時間差分算法獲取穩健動作值的近似值; 基于獲取的所述穩健動作值的近似值,采用穩健Actor-Critic學習算法獲取最優控制策略函數的解,即獲取所述最優控制策略; 其中,所述穩健動作值的表達式包括: 其中,表示初始狀態下的穩健狀態值對應的穩健動作值,,表示狀態空間;表示對多次狀態轉移為的情況下獲得的期望累計信息量;表示不同的多次狀態轉移中對應的最壞情況下收集的期望累計信息量;表示無人機在總的飛行時間內進行的最大決策次數;表示折扣因子,滿足;表示無人機在狀態時收集到的所有節點信息量之和的歸一化值,表示無人機在第次決策時所采取的動作,,表示動作空間;表示初始動作;表示由參數確定的控制策略; 所述狀態空間的表達式包括: 其中,表示時刻時無人機所處位置的三維坐標;和分別表示無人機飛行高度的最小值和最大值;表示無人機在垂直方向上的爬升角;表示無人機在水平方向上的偏航角;表示矩陣轉置操作; 所述動作空間的表達式包括: 其中,表示無人機的飛行速度;和分別表示偏航角的角速率和爬升角的角速率;和分別表示偏航角的角速率的最大值和爬升角的角速率的最大值;和分別表示無人機的飛行速度的最小值和最大值。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人中國人民解放軍國防科技大學,其通訊地址為:410073 湖南省長沙市開福區德雅路109號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。