西北工業大學李揚獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉西北工業大學申請的專利一種對于智能體的攻擊策略生成方法及裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114330661B 。
龍圖騰網通過國家知識產權局官網在2025-08-29發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202111647667.7,技術領域涉及:G06N3/0464;該發明授權一種對于智能體的攻擊策略生成方法及裝置是由李揚;李向娟;馮兆文;潘泉設計研發完成,并于2021-12-30向國家知識產權局提交的專利申請。
本一種對于智能體的攻擊策略生成方法及裝置在說明書摘要公布了:本發明公開了一種對于智能體的攻擊策略生成方法及裝置,獲取當前時刻智能體的狀態;基于攻擊時間選擇函數和狀態計算當前時刻的攻擊時間選擇值;當攻擊時間選擇值大于第一閾值時,從攻擊動作庫中選擇攻擊動作向智能體進行攻擊;本發明利用攻擊時刻選擇函數可以大幅度減少攻擊次數,從而保證攻擊的隱蔽性;利用訓練好的攻擊動作選擇策略,選擇出使累計獎勵降低最多的目標動作進行目標攻擊,從而保證攻擊的有效性,有效減少方法的時間復雜度,從而提高攻擊效率。
本發明授權一種對于智能體的攻擊策略生成方法及裝置在權利要求書中公布了:1.一種對于智能體的攻擊策略生成方法,其特征在于,包括以下步驟: 在進行攻擊實驗之前對智能體進行模型訓練,實驗采用三個卷積層和一個全連接層; 獲取當前時刻智能體的狀態; 基于攻擊時間選擇函數和所述狀態計算當前時刻的攻擊時間選擇值; 當所述攻擊時間選擇值大于第一閾值時,從攻擊動作庫中選擇攻擊動作向所述智能體進行攻擊;所述攻擊為觀測攻擊,所述觀測攻擊為向智能體所接收到的觀測圖像上添加擾動; 其中,所述攻擊時間選擇函數為Ct=απmax-πmin+βπmax-πavg,Ct為攻擊時間選擇值,t表示當前時刻序數,α和β為常量,πmax為在給定狀態下輸出動作概率的最大值,πmin為在給定狀態下輸出動作概率的最小值,πavg為在給定狀態下輸出動作概率的平均值; 計算攻擊成功率與攻擊頻率的差作為第一指標; 計算所述智能體被攻擊后的獎勵值變化度為第二指標; 基于所述第一指標和所述第二指標,確定攻擊策略的攻擊效果值; 所述攻擊策略的攻擊效果值通過F=0.5×ΔR+Δfrequency計算得出; 其中,F為攻擊效果值,ΔR為第二指標,Δfrequency為第一指標; 從攻擊動作庫中選擇攻擊動作向所述智能體進行攻擊包括: 以所述智能體在攻擊周期內的獎勵值最小為目標從攻擊動作庫中選擇攻擊動作。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人西北工業大學,其通訊地址為:710072 陜西省西安市友誼西路127號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。