四川大學彭德中獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉四川大學申請的專利一種基于統一生成模型的知識驅動對話方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115952265B 。
龍圖騰網通過國家知識產權局官網在2025-08-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202211633699.6,技術領域涉及:G06F16/3329;該發明授權一種基于統一生成模型的知識驅動對話方法是由彭德中;張蔚琪;王騫;孫元設計研發完成,并于2022-12-19向國家知識產權局提交的專利申請。
本一種基于統一生成模型的知識驅動對話方法在說明書摘要公布了:本發明公開了一種基于統一生成模型的知識驅動對話方法,屬于自然語言處理技術領域,通過數據格式化模塊將輸入數據字段統一格式,得到數據格式化模塊的實體預測模式、屬性預測模式和對話生成模式;獲取混合訓練集;基于混合訓練集和負對數似然損失函數訓練并得到統一生成模型;利用數據格式化模塊、統一生成模型和知識庫對待測試的歷史對話選擇外部知識,并對待測試的歷史對話進行預測回復;本發明通過將知識驅動對話系統中復雜眾多的流程簡化并合并成實體預測、屬性預測和對話生成三個關鍵任務,統一改造成文本生成問題,使用統一的生成模型進行多任務建模,解決了現有知識驅動對話模型眾多、實現復雜、顯存占用大和推理耗時長的問題。
本發明授權一種基于統一生成模型的知識驅動對話方法在權利要求書中公布了:1.一種基于統一生成模型的知識驅動對話方法,其特征在于,包括如下步驟: S1、通過數據格式化模塊將輸入數據字段統一格式,得到數據格式化模塊的實體預測模式、屬性預測模式和對話生成模式; S2、基于知識驅動對話數據集Kdconv以及數據格式化模塊的實體預測模式、屬性預測模式和對話生成模式,得到由實體預測訓練集、屬性預測訓練集和對話生成訓練集構成的混合訓練集,具體為: S21、獲取由對話數據集KdConv conv和外部知識庫KdConv kg構成的知識驅動對話數據集Kdconv,并將初始實體預測訓練集、初始屬性預測訓練集和初始對話生成訓練集均設置為空列表; S22、逐一循環遍歷對話數據集KdConv conv中的任一對話樣本中的第i個句子,并將該句子作為第i個回復,并將其對應對話樣本中在其前面的句子作為第i段歷史對話,其中,,表示對話樣本中的句子總數; S23、獲取第i個回復對應的第i個三元組列表Kg_ls i中的所有實體,構建對應的第i個實體集Entity_set i,針對第i個三元組列表Kg_ls i不為空列表時,第i個實體集Entity_set i由第i個三元組列表Kg_ls i中的所有實體構成,否則將第i個實體集Entity_ set i統一設置為空實體集,其中,空實體集內僅包括空字符‘無’; S24、將第i段歷史對話和第i個實體集Entity_set i作為輸入數據字段,并利用數據格式化模塊的實體預測模式,得到第i個實體預測結果,且將第i個實體預測結果加入初始實體預測訓練集,其中,表示第i個實體編碼文本,表示第i個實體解碼文本; S25、針對第i個實體集Entity_set i為非空集合時,則從第i個三元組列表Kg_ls i中獲取第i個實體集Entity_set i中任一實體實際使用的屬性集,從外部知識庫KdConv kg中獲取該實體的所有屬性All_attr j,其中,,表示第i個實體集Entity_set i中的實體總數; S26、將第i段歷史對話、第i個實體集Entity_set i中任一實體、該實體的所有屬性All_attr j和實際使用的屬性集作為輸入數據字段,并利用數據格式化模塊的屬性預測模式,得到第j個屬性預測結果,且將第j個屬性預測結果加入初始屬性預測訓練集,其中,表示第j個屬性編碼文本,表示第j個屬性解碼文本; S27、將第i段歷史對話、第i個三元組列表Kg_ls i和第i個回復作為輸入數據字段,并利用數據格式化模塊的對話生成模式,得到第i個對話生成結果,且將第i個對話生成結果加入初始對話生成訓練集,其中,表示第i個對話編碼文本,表示第i個對話解碼文本; S28、重復步驟S22至步驟S27,直至對話數據集KdConv conv中的所有對話樣本均被循環遍歷完,得到完整的實體預測訓練集、屬性預測訓練集和對話生成訓練集; S29、將實體預測訓練集、屬性預測訓練集和對話生成訓練集混合,得到混合訓練集,其中,混合訓練集內的各訓練樣本均為(編碼端文本,解碼端文本)的格式; S3、基于混合訓練集和負對數似然損失函數訓練并得到統一生成模型; S4、利用數據格式化模塊、統一生成模型和知識庫對待測試的歷史對話選擇外部知識,并對待測試的歷史對話進行預測回復。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人四川大學,其通訊地址為:610044 四川省成都市武侯區一環路南一段24號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。