潤聯軟件系統(深圳)有限公司王偉獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉潤聯軟件系統(深圳)有限公司申請的專利抽取式文本摘要生成方法、裝置、計算機設備及存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114706973B 。
龍圖騰網通過國家知識產權局官網在2025-08-08發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210433352.0,技術領域涉及:G06F16/34;該發明授權抽取式文本摘要生成方法、裝置、計算機設備及存儲介質是由王偉;張黔;陳煥坤;鄭毅設計研發完成,并于2022-04-24向國家知識產權局提交的專利申請。
本抽取式文本摘要生成方法、裝置、計算機設備及存儲介質在說明書摘要公布了:本申請實施例屬于人工智能技術領域,涉及一種抽取式文本摘要生成方法,包括將訓練語料中的每個句子進行句子編號,將編號后的每個句子進行分詞處理,得到分詞結果,根據分詞結果分別計算每個句子的詞級信息熵和短語級信息熵,對句子進行特征提取,根據提取到的句子特征向量得到句子級信息熵,根據詞級信息熵、短語級信息熵以及句子級信息熵,計算得到句子的貢獻度,基于貢獻度選取目標訓練句子,根據目標訓練句子對預構建的神經網絡進行訓練,得到文本摘要生成模型,將目標文本輸入文本摘要生成模型,輸出文本摘要。本申請還提供一種抽取式文本摘要生成裝置、計算機設備及存儲介質。本申請可以提高文本摘要的信息量,進一步提高文本摘要的質量。
本發明授權抽取式文本摘要生成方法、裝置、計算機設備及存儲介質在權利要求書中公布了:1.一種抽取式文本摘要生成方法,其特征在于,包括下述步驟: 獲取訓練語料,將所述訓練語料中的每個句子進行句子編號; 將編號后的每個所述句子進行分詞處理,得到分詞結果; 根據分詞結果分別計算每個所述句子的詞級信息熵和短語級信息熵; 對所述句子進行特征提取,獲得句子特征向量; 根據所述句子特征向量得到所述句子的句子級信息熵; 根據所述詞級信息熵、所述短語級信息熵以及所述句子級信息熵,計算得到句子的貢獻度; 基于所述貢獻度選取N個句子作為目標訓練句子,將所述目標訓練句子形成行動集合,根據所述目標訓練句子對預構建的多層神經網絡模型進行訓練,得到文本摘要生成模型;其中,所述目標訓練句子中的一個句子為一個行動,所述多層神經網絡模型每次只輸出一個結果,共需要輸出N個結果; 獲取目標文本,將所述目標文本輸入所述文本摘要生成模型,輸出文本摘要; 其中,所述根據分詞結果分別計算每個所述句子的詞級信息熵和短語級信息熵的步驟包括: 確定所述分詞結果中每個詞語的詞語概率; 根據所述詞語概率計算得到所述詞級信息熵; 從所述分詞結果中抽取目標短語,并確定目標短語的短語概率; 根據所述短語概率計算得到所述短語級信息熵; 所述根據所述句子特征向量得到所述句子的句子級信息熵的步驟包括: 計算每個句子之間的相似度,根據所述相似度得到每個句子的句子出現頻率; 根據所述句子出現頻率計算得到所述句子級信息熵。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人潤聯軟件系統(深圳)有限公司,其通訊地址為:518000 廣東省深圳市福田區梅林街道梅都社區中康路136號深圳新一代產業園2棟801;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。