• <form id="tsg3z"></form>

    <thead id="tsg3z"></thead>
      <abbr id="tsg3z"><table id="tsg3z"><nav id="tsg3z"></nav></table></abbr>

    1. 男女性杂交内射女bbwxz,亚洲欧美人成电影在线观看,中文字幕国产日韩精品,欧美另类精品xxxx人妖,欧美日韩精品一区二区三区高清视频,日本第一区二区三区视频,国产亚洲精品中文字幕,gogo无码大胆啪啪艺术
      Document
      拖動(dòng)滑塊完成拼圖
      個(gè)人中心

      預(yù)訂訂單
      服務(wù)訂單
      發(fā)布專利 發(fā)布成果 人才入駐 發(fā)布商標(biāo) 發(fā)布需求

      在線咨詢

      聯(lián)系我們

      龍圖騰公眾號(hào)
      首頁 專利交易 IP管家助手 科技果 科技人才 科技服務(wù) 國(guó)際服務(wù) 商標(biāo)交易 會(huì)員權(quán)益 需求市場(chǎng) 關(guān)于龍圖騰
       /  免費(fèi)注冊(cè)
      到頂部 到底部
      清空 搜索
      • 我要求購(gòu)
      • 我要出售
      當(dāng)前位置 : 首頁 > 專利喜報(bào) > 中國(guó)礦業(yè)大學(xué)王雪松獲國(guó)家專利權(quán)

      中國(guó)礦業(yè)大學(xué)王雪松獲國(guó)家專利權(quán)

      買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!

      龍圖騰網(wǎng)獲悉中國(guó)礦業(yè)大學(xué)申請(qǐng)的專利一種基于擴(kuò)散狀態(tài)規(guī)劃的決策Transformer離線強(qiáng)化學(xué)習(xí)方法獲國(guó)家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國(guó)家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN120181138B

      龍圖騰網(wǎng)通過國(guó)家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-08-12發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202510655213.6,技術(shù)領(lǐng)域涉及:G06N3/045;該發(fā)明授權(quán)一種基于擴(kuò)散狀態(tài)規(guī)劃的決策Transformer離線強(qiáng)化學(xué)習(xí)方法是由王雪松;張恒瑞;程玉虎;萬紅設(shè)計(jì)研發(fā)完成,并于2025-05-21向國(guó)家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。

      一種基于擴(kuò)散狀態(tài)規(guī)劃的決策Transformer離線強(qiáng)化學(xué)習(xí)方法在說明書摘要公布了:本發(fā)明公開了一種基于擴(kuò)散狀態(tài)規(guī)劃的決策Transformer離線強(qiáng)化學(xué)習(xí)方法,屬于離線強(qiáng)化學(xué)習(xí)和序列決策技術(shù)領(lǐng)域,首先,鑒于現(xiàn)有條件序列建模的離線強(qiáng)化學(xué)習(xí)方法缺乏軌跡拼接能力,并且難以根據(jù)驅(qū)動(dòng)回報(bào)進(jìn)行合理的信用分配,引入高回報(bào)子目標(biāo)狀態(tài)以重新構(gòu)建軌跡表征;然后,使用無分類器引導(dǎo)的擴(kuò)散模型規(guī)劃出具有高回報(bào)的狀態(tài)序列;最后,使用決策Transformer根據(jù)已有軌跡和規(guī)劃出的狀態(tài)輸出高質(zhì)量的動(dòng)作序列。本發(fā)明可以顯著地增加序列建模方法的軌跡拼接能力,從而進(jìn)行合理的信用分配。

      本發(fā)明授權(quán)一種基于擴(kuò)散狀態(tài)規(guī)劃的決策Transformer離線強(qiáng)化學(xué)習(xí)方法在權(quán)利要求書中公布了:1.一種基于擴(kuò)散狀態(tài)規(guī)劃的決策Transformer離線強(qiáng)化學(xué)習(xí)方法,其特征在于,包括以下步驟: 將智能體的狀態(tài)軌跡輸入到訓(xùn)練好的無分類器引導(dǎo)的擴(kuò)散模型中,規(guī)劃出高回報(bào)子目標(biāo)狀態(tài)序列,其中,表示獎(jiǎng)勵(lì)的累計(jì),表示狀態(tài),表示序列長(zhǎng)度,表示高回報(bào)子目標(biāo)狀態(tài); 將所述高回報(bào)子目標(biāo)狀態(tài)序列與狀態(tài)軌跡進(jìn)行拼接,得到拼接后的狀態(tài)軌跡;表示動(dòng)作, 將所述拼接后的狀態(tài)軌跡輸入到訓(xùn)練好的決策Transformer模型,生成最優(yōu)動(dòng)作序列; 對(duì)所述無分類器引導(dǎo)的擴(kuò)散模型的訓(xùn)練過程為: 首先初始化所述無分類器引導(dǎo)的擴(kuò)散模型網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù); 再采用經(jīng)驗(yàn)池中的狀態(tài)軌跡樣本對(duì)所述網(wǎng)絡(luò)參數(shù)進(jìn)行更新,所述更新的方法為通過梯度下降法最小化如下?lián)p失函數(shù): ; 其中,表示無分類器引導(dǎo)的擴(kuò)散模型網(wǎng)絡(luò)損失函數(shù),表示期望符號(hào),表示離散集上的均勻分布,表示擴(kuò)散步數(shù),表示預(yù)定義噪聲,~表示采樣操作,表示標(biāo)準(zhǔn)高斯分布,表示第步擴(kuò)散的狀態(tài)軌跡樣本,條件以概率置空,記為: ; 其中,表示狀態(tài)軌跡樣本對(duì)應(yīng)的累計(jì)回報(bào),表示空集,表示獎(jiǎng)勵(lì)的累計(jì); 對(duì)所述決策Transformer模型的訓(xùn)練過程為: 首先初始化所述決策Transformer網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù); 將經(jīng)驗(yàn)池中的狀態(tài)軌跡樣本與高回報(bào)子目標(biāo)狀態(tài)進(jìn)行拼接,得到拼接后的軌跡樣本,基于所述拼接后的軌跡樣本對(duì)所述網(wǎng)絡(luò)參數(shù)進(jìn)行更新; 所述更新的方法為通過梯度下降法最小化如下?lián)p失函數(shù): ; 其中,表示決策Transformer網(wǎng)絡(luò)的損失函數(shù),表示對(duì)軌跡中的值求期望,表示序列長(zhǎng)度,表示在第個(gè)時(shí)間步從經(jīng)驗(yàn)池中采樣出的動(dòng)作,表示決策Transformer網(wǎng)絡(luò)在第個(gè)時(shí)間步的動(dòng)作輸出。

      如需購(gòu)買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人中國(guó)礦業(yè)大學(xué),其通訊地址為:221148 江蘇省徐州市銅山區(qū)大學(xué)路1號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。

      免責(zé)聲明
      1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
      2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
      主站蜘蛛池模板: 香蕉久久国产精品免| 欧美成人精品手机在线| 日本无产久久99精品久久| 少妇高潮激情一区二区三| 精品自拍偷拍一区二区三区| 国产成人精品一区二区不卡| 小伙无套内射老熟女精品| 色狠狠色婷婷丁香五月| 国产精品无码av不卡| 深夜av在线免费观看| 久久精品国产99久久久古代| 无套后入极品美女少妇| 日本亚洲中文字幕不卡| 亚洲AV旡码高清在线观看| 人妻精品动漫H无码中字| 国内少妇偷人精品免费| 亚洲情综合五月天| 免费人成再在线观看视频| 亚洲精品国产自在现线最新| 久久精品国产亚洲av久| 久久精品免费自拍视频| 中文字幕亚洲国产精品| 四虎在线成人免费观看| 97一期涩涩97片久久久久久久| 极品少妇的粉嫩小泬看片| 偷拍专区一区二区三区| 亚洲av日韩av中文高清性色| 久久精品丝袜高跟鞋| 久久热这里只有精品99| 国产精品成人久久电影| 日本免费最新高清不卡视频| av永久免费网站在线观看| 日韩大尺度一区二区三区| 国产精品人成在线播放蜜臀| 精品免费看国产一区二区| julia无码中文字幕一区| 国产边打电话边被躁视频| 亚洲国产精品日韩AV专区| 国产成人精品国产成人亚洲 | 国产不卡精品一区二区三区| VA在线看国产免费|