廈門淵亭信息科技有限公司洪萬福獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉廈門淵亭信息科技有限公司申請的專利一種結(jié)合大模型與自博弈技術(shù)的自主決策方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN120450491B 。
龍圖騰網(wǎng)通過國家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-09-05發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號(hào)為:202510919479.7,技術(shù)領(lǐng)域涉及:G06Q10/0637;該發(fā)明授權(quán)一種結(jié)合大模型與自博弈技術(shù)的自主決策方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)是由洪萬福;史金濤;黃在斌設(shè)計(jì)研發(fā)完成,并于2025-07-04向國家知識(shí)產(chǎn)權(quán)局提交的專利申請。
本一種結(jié)合大模型與自博弈技術(shù)的自主決策方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)在說明書摘要公布了:本發(fā)明提供了一種結(jié)合大模型與自博弈技術(shù)的自主決策方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。首先獲取結(jié)構(gòu)化傳感器數(shù)據(jù)和非結(jié)構(gòu)化情報(bào)數(shù)據(jù),并采用MoE架構(gòu)大語言模型處理多模態(tài)信息,將結(jié)果與初始提示詞結(jié)合生成結(jié)構(gòu)化決策輸入;隨后依次由第一層指揮官智能體基于結(jié)構(gòu)化輸入生成多個(gè)候選決策策略,并分配給第二層執(zhí)行智能體模擬執(zhí)行;第三層評估智能體對執(zhí)行結(jié)果進(jìn)行多維度協(xié)同性評估,不滿足預(yù)設(shè)閾值時(shí)將反饋信息返回指揮官智能體調(diào)整策略;最終,對滿足評分條件的候選策略集進(jìn)行模擬博弈,將執(zhí)行結(jié)果及評分?jǐn)?shù)據(jù)重新輸入MoE大語言模型,融合生成最終決策方案,并以評分閾值為終止條件輸出。解決了現(xiàn)有的自主決策無法面對復(fù)雜動(dòng)態(tài)的戰(zhàn)場環(huán)境需求的問題。
本發(fā)明授權(quán)一種結(jié)合大模型與自博弈技術(shù)的自主決策方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)在權(quán)利要求書中公布了:1.一種結(jié)合大模型與自博弈技術(shù)的自主決策方法,其特征在于,包括: 獲取多模態(tài)數(shù)據(jù),采用MoE架構(gòu)的大語言模型對所述多模態(tài)數(shù)據(jù)進(jìn)行處理,將處理后的數(shù)據(jù)與初始提示詞結(jié)合生成結(jié)構(gòu)化決策輸入,其中,所述多模態(tài)數(shù)據(jù)包括結(jié)構(gòu)化傳感器數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù); 調(diào)用預(yù)構(gòu)建的三層異步分層智能體對所述結(jié)構(gòu)化決策輸入依次處理,其中,所述三層異步分層智能體包括第一層指揮官智能體、第二層執(zhí)行智能體和第三層評估智能體,所述第一層指揮官智能體基于所述結(jié)構(gòu)化決策輸入生成多個(gè)候選決策策略,并分配給對應(yīng)的第二層執(zhí)行智能體,具體為:所述第一層指揮官智能體接收所述結(jié)構(gòu)化決策輸入,從中解析出可用智能體資源信息和任務(wù)需求信息,通過任務(wù)分解算法將復(fù)雜任務(wù)拆分為多個(gè)子任務(wù),并基于資源約束、時(shí)間窗口和風(fēng)險(xiǎn)評估生成N個(gè)異步并行的候選策略方案,其中每個(gè)策略方案包含任務(wù)優(yōu)先級矩陣、資源分配向量和執(zhí)行時(shí)序圖;基于所述結(jié)構(gòu)化決策輸入中的智能體能力描述信息,動(dòng)態(tài)構(gòu)建智能體能力匹配矩陣Mi,j,其中i表示所述子任務(wù)的類型和難度系數(shù),j表示第二層執(zhí)行智能體的類型和能力參數(shù),Mi,j通過計(jì)算智能體j的能力向量與任務(wù)i的需求向量之間的相似度得出適配度評分;采用KM算法基于所述智能體能力匹配矩陣Mi,j實(shí)現(xiàn)最優(yōu)任務(wù)分配,將包含具體執(zhí)行參數(shù)、約束條件和協(xié)調(diào)接口的執(zhí)行指令分發(fā)給對應(yīng)的第二層執(zhí)行智能體;所述第二層執(zhí)行智能體接收執(zhí)行指令后,根據(jù)指令中的任務(wù)類型調(diào)用相應(yīng)的專業(yè)決策模塊生成具體行動(dòng)方案;所述第三層評估智能體對所述第二層執(zhí)行智能體生成的決策方案進(jìn)行協(xié)同性評估,當(dāng)評估不通過時(shí),將反饋信息返回至所述第一層指揮官智能體重新生成決策策略; 對通過協(xié)同評估的多個(gè)候選決策策略進(jìn)行模擬博弈,獲取各策略在模擬環(huán)境中的執(zhí)行結(jié)果和評分?jǐn)?shù)據(jù),將所述執(zhí)行結(jié)果和評分?jǐn)?shù)據(jù)重新輸入所述MoE架構(gòu)的大語言模型,基于多個(gè)策略的經(jīng)驗(yàn)數(shù)據(jù)生成融合決策方案,對所述融合決策方案進(jìn)行模擬評估,當(dāng)評分大于等于所述候選決策策略中的最高評分時(shí)輸出最終決策。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人廈門淵亭信息科技有限公司,其通訊地址為:361000 福建省廈門市軟件園二期望海路61號(hào)801單元N8-01;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。


熱門推薦
- 蘋果公司M·范歐斯獲國家專利權(quán)
- 青島海爾洗碗機(jī)有限公司張永奎獲國家專利權(quán)
- 弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會(huì)阿德里安·姆塔薩獲國家專利權(quán)
- 中惠創(chuàng)智無線供電技術(shù)有限公司馬曉濤獲國家專利權(quán)
- 武漢天馬微電子有限公司辛宇獲國家專利權(quán)
- 福特全球技術(shù)公司斯圖爾特·福特獲國家專利權(quán)
- 中核建中核燃料元件有限公司黃帆獲國家專利權(quán)
- 北方民族大學(xué)張白獲國家專利權(quán)
- 佛山市南海強(qiáng)昇非標(biāo)自動(dòng)化設(shè)備有限公司易偉民獲國家專利權(quán)
- 深圳幀觀德芯科技有限公司劉雨潤獲國家專利權(quán)