北京北大軟件工程股份有限公司趙文獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉北京北大軟件工程股份有限公司申請的專利一種生成文本摘要的方法、裝置及存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114860873B 。
龍圖騰網通過國家知識產權局官網在2025-08-22發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210424334.6,技術領域涉及:G06F16/334;該發明授權一種生成文本摘要的方法、裝置及存儲介質是由趙文;靳新磊;高謙;馬達森;季昕設計研發完成,并于2022-04-22向國家知識產權局提交的專利申請。
本一種生成文本摘要的方法、裝置及存儲介質在說明書摘要公布了:本申請一些實施例提供了一種生成文本摘要的方法、裝置及存儲介質,涉及信息處理技術領域,該方法包括對初始文本進行分塊處理,獲取處理后的文本數據;將所述文本數據輸入到目標摘要生成模型,獲取目標摘要,其中,所述目標摘要生成模型包括第一目標文本模型和第二目標文本模型,所述第一目標文本模型是通過訓練第一文本模型得到的,所述第二目標文本模型是通過訓練第二文本模型得到的,所述第一目標文本模型用于提取所述文本數據包括的目標信息,所述第二目標文本模型用于根據所述目標信息生成所述目標摘要。本申請一些實施例可以對文本進行準確地信息提取,生成質量較高的文本摘要,且解決了文本信息丟失的問題。
本發明授權一種生成文本摘要的方法、裝置及存儲介質在權利要求書中公布了:1.一種生成文本摘要的方法,其特征在于,包括: 對初始文本進行分塊處理,獲取處理后的文本數據,其中,所述文本數據包括至少兩個文本數據塊,每個文本數據塊采用候選語句集合來表征; 將所述文本數據輸入到目標摘要生成模型,獲取目標摘要,其中,所述目標摘要生成模型包括第一目標文本模型和第二目標文本模型,所述第一目標文本模型是通過訓練第一文本模型得到的,所述第二目標文本模型是通過訓練第二文本模型得到的,所述第一目標文本模型用于提取所述文本數據中每個文本數據塊中的目標語句,通過對每個文本數據塊中的目標語句拼接得到目標信息,所述第二目標文本模型用于根據所述目標信息生成所述目標摘要; 在得到所述第一目標文本模型和所述第二目標文本模型的訓練階段,對所述第一文本模型和所述第二文本模型使用非端到端的訓練方式;在驗證階段,對待測試第一目標文本模型和待測試第二目標文本模型使用了聯合驗證的方式,具體包括: 將驗證集中的文本輸入至待測試第一目標文本模型,獲取待測試第一目標文本模型輸出的參考語句數據,將參考語句數據輸入至待測試第二目標文本模型,獲取待測試第二目標文本模型輸出的與文本對應的摘要數據;基于摘要數據和驗證數據集中的參考摘要數據,優化第一目標文本模型和第二目標文本模型的參數,直至確認第一目標文本模型和第二目標文本模型通過驗證,得到目標摘要生成模型; 在所述獲取目標摘要之后,所述方法還包括: 分別提取所述目標摘要和所述初始文本中的數字字符串,并剔除所述數字字符串中的小數點,所述數字字符串的位數不小于3;基于所述初始文本中的數字字符串,對所述目標摘要中的數字字符串進行檢驗,獲取出錯字符;根據初始文本中的數字字符串,替換所述出錯字符,得到替換后的目標摘要。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京北大軟件工程股份有限公司,其通訊地址為:100089 北京市海淀區北四環西路67號中關村國際創新大廈11層1101-1103、1106-1108室;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。