百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司何家樂獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司申請的專利多智能體模型的訓(xùn)練方法和排序方法獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN114896291B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-08-29發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202210470395.6,技術(shù)領(lǐng)域涉及:G06F16/2457;該發(fā)明授權(quán)多智能體模型的訓(xùn)練方法和排序方法是由何家樂;熊健設(shè)計研發(fā)完成,并于2022-04-28向國家知識產(chǎn)權(quán)局提交的專利申請。
本多智能體模型的訓(xùn)練方法和排序方法在說明書摘要公布了:本公開提供了一種多智能體模型的訓(xùn)練方法、排序方法、裝置、設(shè)備、存儲介質(zhì)以及計算機(jī)程序產(chǎn)品,涉及人工智能技術(shù)領(lǐng)域,具體為深度學(xué)習(xí)和智能推薦技術(shù)領(lǐng)域,可應(yīng)用于數(shù)據(jù)排序等場景。具體實(shí)現(xiàn)方案為:獲取訓(xùn)練樣本集;執(zhí)行以下訓(xùn)練步驟:從訓(xùn)練樣本集中選取多個訓(xùn)練樣本輸入到多智能體模型中進(jìn)行打分,得到多個智能體各自對應(yīng)的打分結(jié)果;將打分結(jié)果進(jìn)行拼接,得到聯(lián)合得分;將聯(lián)合得分輸入到分?jǐn)?shù)評估環(huán)境中,得到多個智能體各自對應(yīng)的獎勵值;基于打分結(jié)果和獎勵值對多智能體模型進(jìn)行訓(xùn)練;響應(yīng)于訓(xùn)練次數(shù)等于預(yù)設(shè)次數(shù)閾值,輸出訓(xùn)練完成的多智能體模型。提高了排序的準(zhǔn)確性。
本發(fā)明授權(quán)多智能體模型的訓(xùn)練方法和排序方法在權(quán)利要求書中公布了:1.一種多智能體模型的訓(xùn)練方法,包括: 獲取訓(xùn)練樣本集; 執(zhí)行以下訓(xùn)練步驟: 從所述訓(xùn)練樣本集中選取多個訓(xùn)練樣本輸入到多智能體模型中各個智能體的打分網(wǎng)絡(luò)進(jìn)行打分,得到多個智能體各自對應(yīng)的打分結(jié)果; 將所述打分結(jié)果進(jìn)行拼接,得到聯(lián)合得分; 將所述聯(lián)合得分輸入到分?jǐn)?shù)評估環(huán)境中,得到所述多個智能體各自對應(yīng)的獎勵值; 基于所述打分結(jié)果和所述獎勵值對所述多智能體模型進(jìn)行訓(xùn)練,是基于每一個智能體對應(yīng)的打分結(jié)果和獎勵值對各個智能體單獨(dú)進(jìn)行訓(xùn)練,包括:基于每一個智能體的所述打分結(jié)果和所述獎勵值對對應(yīng)的智能體的評估網(wǎng)絡(luò)進(jìn)行訓(xùn)練;基于所述多個訓(xùn)練樣本和訓(xùn)練后的所述評估網(wǎng)絡(luò)對對應(yīng)的智能體的所述打分網(wǎng)絡(luò)進(jìn)行訓(xùn)練; 響應(yīng)于訓(xùn)練次數(shù)等于預(yù)設(shè)次數(shù)閾值,輸出訓(xùn)練完成的多智能體模型; 其中,所述訓(xùn)練樣本集中的一個訓(xùn)練樣本包括一條待推薦數(shù)據(jù)及對應(yīng)的用戶數(shù)據(jù),所述待推薦數(shù)據(jù)包括標(biāo)識數(shù)據(jù)及文本數(shù)據(jù); 在對所述多智能體模型進(jìn)行訓(xùn)練之前,所述方法還包括: 對所述訓(xùn)練樣本集中的訓(xùn)練樣本進(jìn)行特征提取,得到標(biāo)識特征、文本特征和用戶特征; 將每一個訓(xùn)練樣本對應(yīng)的標(biāo)識特征、文本特征和用戶特征拼接為一個特征矩陣,并將得到的多個特征矩陣確定為樣本特征集。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司,其通訊地址為:100085 北京市海淀區(qū)上地十街10號百度大廈三層;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會阿德里安·姆塔薩獲國家專利權(quán)
- 武漢天馬微電子有限公司辛宇獲國家專利權(quán)
- LG電子株式會社具文模獲國家專利權(quán)
- 索倫托藥業(yè)有限公司H·H·吉獲國家專利權(quán)
- 中核建中核燃料元件有限公司黃帆獲國家專利權(quán)
- 北京奇虎科技有限公司肖勝濤獲國家專利權(quán)
- 廈門金瑞鎰工貿(mào)有限公司林欲曉獲國家專利權(quán)
- 華為技術(shù)有限公司范強(qiáng)獲國家專利權(quán)
- 西安艾潤物聯(lián)網(wǎng)技術(shù)服務(wù)有限責(zé)任公司王林祥獲國家專利權(quán)
- 青島海爾洗碗機(jī)有限公司張永奎獲國家專利權(quán)