南京理工大學;上海宇航系統工程研究所吳祥獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉南京理工大學;上海宇航系統工程研究所申請的專利基于任務分配-動作決策一體化的高軌衛星集群追逃方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120297157B 。
龍圖騰網通過國家知識產權局官網在2025-08-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510771846.3,技術領域涉及:G06F30/27;該發明授權基于任務分配-動作決策一體化的高軌衛星集群追逃方法及系統是由吳祥;沈港;張寶恒;陳歡樂;趙高鵬;薄煜明;王超塵設計研發完成,并于2025-06-11向國家知識產權局提交的專利申請。
本基于任務分配-動作決策一體化的高軌衛星集群追逃方法及系統在說明書摘要公布了:本發明提供一種基于任務分配?動作決策一體化的高軌衛星集群追逃方法及系統,該方法首先本發明基于Clohessy?Wiltshire方程(CW方程)實現軌道預報,以未來狀態為依據進行獎勵函數設計,將先驗知識引入模型訓練中;其次本發明將值函數網絡與決策網絡同步訓練,在模型使用階段使用值函數網絡得出當前策略下分配的代價矩陣,并使用匈牙利方法對追方衛星集群進行目標分配,結合訓練好的機動策略搭建了目標分配?動作決策一體化框架,既解決了初始場景中追逃雙方衛星數量不定的問題,又完成了追方衛星集群(追蹤衛星群)的目標分配,應用于衛星數量不同的博弈場景。
本發明授權基于任務分配-動作決策一體化的高軌衛星集群追逃方法及系統在權利要求書中公布了:1.一種基于任務分配-動作決策一體化的高軌衛星集群追逃方法,其特征在于,包括步驟: S1、將衛星作為智能體,設計MADDPG中智能體的狀態,并設計智能體動作空間,初始化環境,基于環境生成狀態觀測; S2、設計基于值函數-匈牙利方法的任務分配方法,生成最優狀態觀測,包括: 以MADDPG中狀態觀測為輸入,評價當前狀態的代價矩陣為輸出,構建值函數網絡;同時引入狀態值函數構建損失函數,進行反向傳播優化訓練值函數網絡; 根據值函數網絡輸出的代價矩陣,使用匈牙利方法生成最優狀態觀測; S3、根據最優狀態觀測和動作空間,在MADDPG中設計適應衛星數量動態變化的Actor和Critic網絡; S4、使用CW方程預測未來時刻衛星狀態變化,引入相對運動學,在編隊集群中考慮衛星的動作,設計獎勵函數,加速Actor網絡收斂; S5、基于設計的任務分配方法以及MADDPG中的Actor和Critic網絡,構建一體化訓練框架,調整超參數進行訓練優化,訓練過程中,Actor網絡與環境交互,生成用于值函數網絡訓練的狀態觀測; S6、通過訓練好的值函數網絡以及Actor網絡得到任務分配方案和動作決策,進行高軌衛星集群追逃; 引入狀態值函數構建損失函數為: ; 其中,是指當前時刻下的獎勵,通過獎勵函數得到,、為智能體t、t+1時刻狀態,為使用神經網絡值對狀態值函數進行擬合得到的函數; 所述獎勵函數為: ; 式中,為考慮編隊的獎勵,是指基于軌道相對運動學的誘導獎勵,是指衛星運動的終端獎勵; 基于軌道相對運動學的誘導獎勵為: ; 式中,表示了衛星在變軌前的狀態,則代表著衛星在施加變軌動作后的狀態,是指以未施加初始動作的狀態為初始狀態,推演第t+1步的衛星位置,衛星在施加動作后的狀態推演使用表示,通過CW方程推演得到。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人南京理工大學;上海宇航系統工程研究所,其通訊地址為:210094 江蘇省南京市玄武區孝陵衛200號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。