• <form id="tsg3z"></form>

    <thead id="tsg3z"></thead>
      <abbr id="tsg3z"><table id="tsg3z"><nav id="tsg3z"></nav></table></abbr>

    1. 男女性杂交内射女bbwxz,亚洲欧美人成电影在线观看,中文字幕国产日韩精品,欧美另类精品xxxx人妖,欧美日韩精品一区二区三区高清视频,日本第一区二区三区视频,国产亚洲精品中文字幕,gogo无码大胆啪啪艺术
      Document
      拖動滑塊完成拼圖
      個人中心

      預訂訂單
      服務訂單
      發布專利 發布成果 人才入駐 發布商標 發布需求

      在線咨詢

      聯系我們

      龍圖騰公眾號
      首頁 專利交易 IP管家助手 科技果 科技人才 科技服務 國際服務 商標交易 會員權益 需求市場 關于龍圖騰
       /  免費注冊
      到頂部 到底部
      清空 搜索
      當前位置 : 首頁 > 專利喜報 > 中國科學院計算技術研究所王琪獲國家專利權

      中國科學院計算技術研究所王琪獲國家專利權

      買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!

      龍圖騰網獲悉中國科學院計算技術研究所申請的專利基于深度強化學習的實時集中式無線網絡調度方法和設備獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114189937B

      龍圖騰網通過國家知識產權局官網在2025-08-29發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202111327752.5,技術領域涉及:H04W72/0446;該發明授權基于深度強化學習的實時集中式無線網絡調度方法和設備是由王琪;何晨濤;黃建輝;徐勇軍設計研發完成,并于2021-11-10向國家知識產權局提交的專利申請。

      基于深度強化學習的實時集中式無線網絡調度方法和設備在說明書摘要公布了:本發明提出一種基于深度強化學習的實時集中式無線網絡調度方法和系統,包括:獲取由一個接入點和多個用戶節點互連組成的無線網絡,在每個時隙,接入點根據所有數據流對應的發送隊列信息,得到各數據流的狀態,集合所有數據流的狀態構成當前時隙的環境狀態,接入點獲取所有數據流的流量模型與鏈路質量作為環境特征信息,將環境狀態和環境特征信息輸入至決策模型,接入點執行決策模型輸出結果對應的調度決策;接入點執行調度決策后,收到網絡環境的反饋;將交互信息和環境狀態和環境特征信息作為經驗,存儲至子區域;從經驗回放池中抽取經驗,以訓練更新當前決策模型。本發明訓練時間不會隨數據流數量增加而快速增長,能夠快速的收斂到最優實時吞吐量。

      本發明授權基于深度強化學習的實時集中式無線網絡調度方法和設備在權利要求書中公布了:1.一種基于深度強化學習的實時集中式無線網絡調度方法,其特征在于,包括: 步驟1、獲取由一個接入點和多個用戶節點互連組成的無線網絡,接入點調度該無線網絡中的所有數據流,該無線網絡中接入點在與網絡環境交互前,在經驗回放池中新建一個子區域; 步驟2、該接入點與網絡環境交互時,在每個時隙,該接入點根據所有數據流對應的發送隊列信息,得到各數據流的狀態,集合所有數據流的狀態構成當前第t個時隙的環境狀態st,同時,該接入點獲取所有數據流的流量模型與鏈路質量作為環境特征信息,將該環境狀態和該環境特征信息輸入至決策模型,該接入點執行該決策模型輸出結果對應的調度決策at; 步驟3、該接入點執行調度決策at后,收到網絡環境的反饋rt和終止標識endt,所有數據流的狀態更新至st+1;將交互信息st,at,rt,st+1,endt和該環境狀態和該環境特征信息作為經驗,存儲至該子區域; 步驟4、從該經驗回放池中抽取經驗,以訓練更新當前該決策模型; 其中,該數據流的狀態由該數據流待調度的緊急程度與該數據流的數據包到達因子組成; 該決策模型的訓練過程包括: 創建兩個具有相同結構的神經網絡,分別為當前網絡和目標網絡,當接入點需要做出調度決策時,會將當前時隙t的環境狀態和環境特征信息輸入至該目標網絡,得到各調度動作的價值,接入點以ε的概率隨機選取一個動作執行調度,以1-ε的概率選擇價值最高的動作執行調度,ε為0到1之間的小數, 當接入點執行動作at后,得到反饋rt和終止標識endt,環境狀態更新至st+1;將交互信息st,at,rt,st+1,endt存儲到該經驗回放池,其中,endt是終止表示符,當t≥L*Prd且t%Prd=0時,endt=true,否則endt=false,L是恒定的正整數,滿足: L*Prd≥maxk∈[1,K]offsetk+Dk 其中,Prd是所有數據流周期的最小公倍數,Dk表示數據流k中數據包的截止期限,offsetk表示數據流k的首個數據包到達時間與網絡開始時間的偏移量,當endt=true時,接入點與當前訓練環境的交互過程結束,開始與另一個訓練環境進行交互; 從經驗回放池中隨機抽取部分交互信息后,通過最小化損失函數來更新該當前網絡的參數,目標網絡的參數θtarget每隔預定時間,會被該當前網絡的參數θcurrent所覆蓋,達到預設訓練時長后,保存當前目標網絡作為該決策模型; ε的計算方法如下: 其中,ε0=0.99,εmin=0.001,train_time指接入點已經交互的環境的數量,初始值為0,當接入點與一個環境交互結束后,該值加1。

      如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人中國科學院計算技術研究所,其通訊地址為:100080 北京市海淀區中關村科學院南路6號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。

      免責聲明
      1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
      2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。
      主站蜘蛛池模板: 精品少妇无码一区二区三批| 国产精品自在自线免费观看| 国内少妇人妻偷人精品| 国产蜜臀av在线一区二区| 国产无码高清视频不卡| 午夜DY888国产精品影院| 日本中文字幕一区二区三| 国产一级特黄性生活大片| 日韩有码中文在线观看| 日韩精品国产二区三区| 亚洲国产一区二区三区四| 亚洲欧洲日产国码久在线| 国产精品原创不卡在线| 国产精品视频中文字幕| 亚洲精品中文字幕一二三| 国产区一区二区现看视频| 六十路老熟妇乱子伦视频| 极品少妇无套内射视频| jizz视频在线观看| 春菜花亚洲一区二区三区| 国产无遮挡裸体免费久久| 亚洲一区二区三区在线| 最新国产AV最新国产在钱| 亚洲成色精品一二三区| 久久精品夜色噜噜亚洲aa| 国产色婷婷亚洲99精品小说| 最新成免费人久久精品| 国产99青青成人A在线| 桃花岛亚洲成在人线AV| 国产偷自一区二区三区在线| 九九热久久只有精品2| 亚洲国产成人久久一区久久| 潮喷失禁大喷水无码| 中文字幕精品亚洲二区| 成人区人妻精品一区二区| 国产精品亚洲av三区色| 欧美videos粗暴| 国产精品任我爽爆在线播放6080| 熟妇人妻不卡中文字幕| 影音先锋啪啪av资源网站| 一区二区精品久久蜜精品|