福州大學林瑞全獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉福州大學申請的專利基于深度強化學習的能量采集認知物聯網資源分配方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115712497B 。
龍圖騰網通過國家知識產權局官網在2025-08-08發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202211278767.1,技術領域涉及:G06F9/50;該發明授權基于深度強化學習的能量采集認知物聯網資源分配方法是由林瑞全;劉佳鑫;丘航丁;王俊;鮑家旺;王銳亮設計研發完成,并于2022-10-19向國家知識產權局提交的專利申請。
本基于深度強化學習的能量采集認知物聯網資源分配方法在說明書摘要公布了:本發明涉及一種基于深度強化學習的能量采集認知物聯網資源分配方法,包括:搭建能量采集認知物聯網系統模型,并推導出資源分配的數學模型;搭建強化學習模型,將次發射機到次接收機、協作干擾器到竊聽節點這兩條鏈路的2m條子信道以及一個能量采集時間分配網絡共建模為2m+1個強化學習智能體,能量采集認知物聯網中的其他部分為強化學習環境,智能體與環境不斷進行交互;構建基于深度強化學習的能量采集認知物聯網資源分配模型,并對其進行訓練;通過訓練好的資源分配模型對認知物聯網進行聯合能量采集時間和傳輸功率的最優分配。該方法有利于對能量采集認知物聯網資源進行最優分配。
本發明授權基于深度強化學習的能量采集認知物聯網資源分配方法在權利要求書中公布了:1.一種基于深度強化學習的能量采集認知物聯網資源分配方法,其特征在于,包括: 搭建能量采集認知物聯網資源分配模型,并推導出資源分配的數學模型; 構建基于深度強化學習的能量采集認知物聯網資源分配模型,將次發射機到次接收機、協作干擾器到竊聽節點這兩條鏈路的2m條子信道以及一個能量采集時間分配網絡t0共建模為2m+1個強化學習智能體,能量采集認知物聯網資源分配模型中除強化學習智能體外的其他部分為強化學習環境,智能體與環境不斷進行交互;并對基于深度強化學習的能量采集認知物聯網資源分配模型進行訓練; 通過訓練好的能量采集認知物聯網資源分配模型對認知物聯網進行聯合能量采集時間和傳輸功率的最優分配; 對基于深度強化學習的能量采集認知物聯網資源分配模型進行訓練,具體包括以下步驟: S1、生成認知物聯網的拓撲結構,初始化每條鏈路的信道增益,回合訓練次數N,經驗緩沖池Dk的最大容量Nk,以及決策網絡權重參數θk和目標網絡權重參數其中 S2、在每個訓練回合的開始,隨機初始化認知物聯網所有節點的位置,更新每條鏈路的信道增益,設置環境的初始狀態為S0; S3、在每個訓練回合的第t=0,1,2,…,Tmax-1個時間步,基于當前環境狀態St,每個智能體k獲得環境局部觀測并根據ε-greedy算法采取動作更新ST和J的電池容量和更新信道增益,當前環境狀態St轉移到下一狀態St+1,智能體k獲得下一個局部觀測和獎勵rt; S4、更新神經網絡參數θk和即從Dk中隨機抽取設定批量的樣本送入決策網絡,計算損失函數Lθk,并進行梯度下降最小化Lθk更新參數θk;每間隔M個連續時間步將θk復制給目標網絡權重參數 所述步驟S3中,在每個訓練回合的第t=0,1,2,…,Tmax-1個時間步,基于當前環境狀態St,每個智能體獲得環境局部觀測并根據ε-greedy算法采取動作: 式中,智能體的動作空間 ct為能量采集時間系數,L1為離散時間層級,L2為離散功率層級,Q為估計狀態-動作價值函數,p為隨機生成的概率,ε∈0,1為給定的概率閾值;根據下列公式更新ST和J的電池容量: 其中,分別為ST和J采集到的能量,分別為ST和J的可用電池容量,BsT,max、BST,max分別為ST和J的最大電池容量,為相關時間系數,T為傳輸塊的長度;然后基于瑞利信道衰落模型更新信道增益,環境的當前狀態St轉移到下一狀態St+1={Gt,SINRt,Bt-1},智能體k獲得下一個局部觀測和獎勵: 式中, μ1+μ2+μ3=1, η1+η2+η3=1, 0≤μ1,μ2,μ3,η1,η2,η3≤1, 并將狀態轉移存儲到經驗緩沖池Dk中,置St+1為當前的狀態St。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人福州大學,其通訊地址為:350108 福建省福州市閩侯縣福州大學城烏龍江北大道2號福州大學;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。