創(chuàng)意信息技術(shù)股份有限公司花福軍獲國(guó)家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉創(chuàng)意信息技術(shù)股份有限公司申請(qǐng)的專利一種基于上下文提示的世界模型增強(qiáng)方法及裝置獲國(guó)家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國(guó)家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN120373360B 。
龍圖騰網(wǎng)通過國(guó)家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-09-02發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202510855255.4,技術(shù)領(lǐng)域涉及:G06N3/0455;該發(fā)明授權(quán)一種基于上下文提示的世界模型增強(qiáng)方法及裝置是由花福軍;胡小剛;羅欽;王波;孫明;惠孛設(shè)計(jì)研發(fā)完成,并于2025-06-25向國(guó)家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。
本一種基于上下文提示的世界模型增強(qiáng)方法及裝置在說明書摘要公布了:本發(fā)明提供了一種基于上下文提示的世界模型增強(qiáng)方法及裝置,屬于深度強(qiáng)化學(xué)習(xí)技術(shù)領(lǐng)域。方法根據(jù)當(dāng)前圖像輸入得到圖像描述語句;通過卷積神經(jīng)網(wǎng)絡(luò)得到當(dāng)前圖像輸入的向量表示,利用語言模型得到圖像描述語句的向量表示,將圖向量表示與語句向量表示拼接,得到新的向量表示;將新的向量表示利用循環(huán)神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)對(duì)世界模型的建模,世界模型根據(jù)當(dāng)前的向量輸入,在歷史動(dòng)作和環(huán)境信息上下文基礎(chǔ)上進(jìn)行動(dòng)作決策,有效減輕了智能體探索時(shí)的軌跡回退現(xiàn)象出現(xiàn)的頻率。在環(huán)境變化時(shí),智能體能根據(jù)上下文信息及時(shí)進(jìn)行調(diào)整,提高智能體的適應(yīng)性與靈活性。本發(fā)明有效減少了智能體錯(cuò)誤決策的可能性,有效提升了在限定步數(shù)之內(nèi)智能體的背景任務(wù)完成數(shù)量。
本發(fā)明授權(quán)一種基于上下文提示的世界模型增強(qiáng)方法及裝置在權(quán)利要求書中公布了:1.一種基于上下文提示的世界模型增強(qiáng)方法,其特征在于,包括: 獲取仿真環(huán)境的背景任務(wù)描述語句、環(huán)境觀測(cè)圖像和智能體的歷史動(dòng)作指令信息,并利用多模態(tài)大語言模型從所述環(huán)境觀測(cè)圖像中提取出圖像描述語句上下文信息;其中,所述歷史動(dòng)作指令信息拼接在圖像描述語句上下文信息的語句末尾; 利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)所述環(huán)境觀測(cè)圖像進(jìn)行視覺特征提取,得到圖像特征向量,并對(duì)所述背景任務(wù)描述語句和圖像描述語句上下文信息進(jìn)行文本特征提取,分別得到背景任務(wù)特征向量和上下文文本特征向量,同時(shí)將背景任務(wù)特征向量與上下文文本特征向量拼接為第一文本特征向量,并將第一文本特征向量與所述圖像特征向量進(jìn)行融合,得到融合特征向量; 將智能體的歷史動(dòng)作指令信息和融合特征向量輸入循環(huán)神經(jīng)網(wǎng)絡(luò)中進(jìn)行確定性狀態(tài)更新,并根據(jù)確定性狀態(tài)更新結(jié)果對(duì)當(dāng)前仿真環(huán)境進(jìn)行建模,得到世界模型; 智能體基于世界模型,利用演員評(píng)論家算法進(jìn)行想象學(xué)習(xí),并根據(jù)想象學(xué)習(xí)結(jié)果確定智能體的當(dāng)前最佳動(dòng)作序列;依據(jù)當(dāng)前最佳動(dòng)作序列在仿真環(huán)境中執(zhí)行動(dòng)作,同時(shí)獲取執(zhí)行動(dòng)作后仿真環(huán)境給出的動(dòng)作反饋、環(huán)境狀態(tài)更新信息和更新后的智能體可視圖像,判斷動(dòng)作執(zhí)行后是否成功完成仿真環(huán)境中的背景任務(wù),若動(dòng)作執(zhí)行后未成功完成背景任務(wù),則依據(jù)更新后的智能體可視圖像進(jìn)行動(dòng)作決策,根據(jù)動(dòng)作決策結(jié)果調(diào)整當(dāng)前最佳動(dòng)作序列,并執(zhí)行下一動(dòng)作;若動(dòng)作執(zhí)行后成功完成背景任務(wù),則仿真環(huán)境同時(shí)返回值為1的獎(jiǎng)勵(lì)。
如需購(gòu)買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人創(chuàng)意信息技術(shù)股份有限公司,其通訊地址為:610000 四川省成都市青羊區(qū)紅星路一段86號(hào)1棟222號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 美蓓亞三美株式會(huì)社淺川壽昭獲國(guó)家專利權(quán)
- 三星電子株式會(huì)社高民求獲國(guó)家專利權(quán)
- 豪倍公司D·里奇?zhèn)カ@國(guó)家專利權(quán)
- 立積電子股份有限公司林昭毅獲國(guó)家專利權(quán)
- LG電子株式會(huì)社具文模獲國(guó)家專利權(quán)
- 麻省理工學(xué)院布倫丹·德里克·史密斯獲國(guó)家專利權(quán)
- 南通帝誠(chéng)華信實(shí)業(yè)有限公司張?jiān)魄瀚@國(guó)家專利權(quán)
- 三星顯示有限公司賈智鉉獲國(guó)家專利權(quán)
- 華為技術(shù)有限公司范強(qiáng)獲國(guó)家專利權(quán)
- 杭州巨星科技股份有限公司李躍明獲國(guó)家專利權(quán)


熱門推薦
- 顧澤蒼獲國(guó)家專利權(quán)
- 福建福船一帆新能源裝備制造有限公司高險(xiǎn)峰獲國(guó)家專利權(quán)
- 福特全球技術(shù)公司鄧治兵獲國(guó)家專利權(quán)
- 蘋果公司M·范歐斯獲國(guó)家專利權(quán)
- 北京小米移動(dòng)軟件有限公司趙群獲國(guó)家專利權(quán)
- 日本電氣株式會(huì)社袁方獲國(guó)家專利權(quán)
- 長(zhǎng)沙衡開智能科技有限公司鄒湘衡獲國(guó)家專利權(quán)
- 長(zhǎng)鑫存儲(chǔ)技術(shù)有限公司請(qǐng)求不公布姓名獲國(guó)家專利權(quán)
- 上海宇晝科技有限公司陳加成獲國(guó)家專利權(quán)
- 北方民族大學(xué)張白獲國(guó)家專利權(quán)