成都華棲云科技有限公司蔣文獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉成都華棲云科技有限公司申請的專利文本意圖重構方法、裝置、設備、存儲介質及計算機產品獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120256589B 。
龍圖騰網通過國家知識產權局官網在2025-08-19發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510727398.7,技術領域涉及:G06F16/3329;該發明授權文本意圖重構方法、裝置、設備、存儲介質及計算機產品是由蔣文;張亞敏;趙永生;顏濤;丁海洋;姜錸;袁官銳;劉傳真設計研發完成,并于2025-06-03向國家知識產權局提交的專利申請。
本文本意圖重構方法、裝置、設備、存儲介質及計算機產品在說明書摘要公布了:本申請公開了一種文本意圖重構方法、裝置、設備、存儲介質及計算機產品,涉及自然語言處理技術領域,方法包括:獲取意圖重構樣本集合;意圖重構樣本集合包括輸入樣本數據和輸出樣本數據;其中,輸出樣本數據攜帶語義標志位;基于意圖重構樣本集合和訓練目標損失函數對預訓練模型進行指令監督微調,獲得文本意圖重構模型;其中訓練目標損失函數的損失權重基于語義標志位的分布情況確定;將待重構文本輸入至文本意圖重構模型,獲得文本意圖重構結果。本申請利用基于語義標志位損失函數更新策略,提升了文本意圖重構的質量,實現了文本意圖重構模型的高效訓練、穩健泛化與響應質量的顯著提升。
本發明授權文本意圖重構方法、裝置、設備、存儲介質及計算機產品在權利要求書中公布了:1.一種文本意圖重構方法,其特征在于,所述的方法包括: 獲取意圖重構樣本集合;所述意圖重構樣本集合包括輸入樣本數據和輸出樣本數據;其中,所述輸出樣本數據攜帶語義標志位; 基于所述意圖重構樣本集合和訓練目標損失函數對預訓練模型進行指令監督微調,獲得文本意圖重構模型;其中所述訓練目標損失函數的損失權重基于所述語義標志位的分布情況確定; 將待重構文本輸入至所述文本意圖重構模型,獲得文本意圖重構結果; 所述輸入樣本數據包括詢問問題信息、歷史對話信息和提示詞,所述輸出樣本數據包括問題改寫信息、問題意圖信息和語義相似性標志位;所述語義相似性標志位基于所述歷史對話信息和所述詢問問題信息的相關程度確定,所述問題改寫信息攜帶意圖重構標志位; 所述基于所述意圖重構樣本集合和訓練目標損失函數對預訓練模型進行指令監督微調,獲得文本意圖重構模型的步驟包括: 對意圖重構樣本進行分詞處理,獲得樣本詞序列; 調用所述預訓練模型對樣本詞序列進行預測,獲得詞序列預測結果; 基于所述訓練目標損失函數,確定意圖重構樣本和所述詞序列預測結果之間的差異,獲得模型損失;所述訓練目標損失函數的損失權重基于所述語義相似性標志位和所述意圖重構標志位的分布情況更新; 基于所述模型損失對所述預訓練模型進行指令監督微調,獲得所述文本意圖重構模型; 所述基于所述訓練目標損失函數,確定意圖重構樣本和所述詞序列預測結果之間的差異,獲得模型損失的步驟包括: 獲取預設損失權重配置信息; 基于預設損失權重配置信息,確定意圖重構標志位和語義相似性標志位所對應的樣本詞序列的損失權重; 基于意圖重構標志位和語義相似性標志位所對應樣本詞序列的損失權重,更新訓練目標損失函數; 基于訓練目標損失函數,確定意圖重構樣本和樣本預測結果之間的差異,獲得模型損失; 所述模型損失的具體計算公式為: 其中,其中為第t個目標token,為模型對該token的預測概率,為該token對應的權重系數;T為輸出序列中有效token的總數。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人成都華棲云科技有限公司,其通訊地址為:610000 四川省成都市高新區天府五街200號菁蓉匯4號樓A區9樓;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。