華東師范大學林欣獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉華東師范大學申請的專利一種文本信息智能處理系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115455935B 。
龍圖騰網通過國家知識產權局官網在2025-08-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202211113958.2,技術領域涉及:G06F40/205;該發明授權一種文本信息智能處理系統是由林欣;李楷達設計研發完成,并于2022-09-14向國家知識產權局提交的專利申請。
本一種文本信息智能處理系統在說明書摘要公布了:本發明公開了一種文本信息智能處理系統,其特點是該系統由文本預處理、知識圖譜構建和知識查詢與問答三個子系統組成,所述文本預處理子系統實現對文檔讀取、掃描和實體抽取等預處理;所述知識圖譜構建子系統抽取文檔中的關系等知識圖譜的基本元素,采用實體匹配、知識融合將這些元素增量更新至知識圖譜中,并實現可視化;所述知識查詢與問答子系統利用構建好的知識圖譜,實現對文檔知識的動態查詢與問答應對。本發明與現有技術相比具有自動處理各類文檔,構建領域知識圖譜對其中的關鍵信息進行存儲、管理、展示,并基于構建好的知識圖譜對用戶輸入的問題實現基于語義的知識搜索和問答功能,為各領域的相關業務職能效率提升提供技術手段支撐。
本發明授權一種文本信息智能處理系統在權利要求書中公布了:1.一種文本信息智能處理系統,其特征在于,采用文本預處理子系統、知識圖譜構建子系統和知識查詢與問答子系統構建的智能系統為文本信息處理工具,實現基于語義的知識搜索和問答,所述文本預處理子系統包括:源文檔信息抽取模塊、基于目錄的粗粒度圖譜構建模塊和實體抽取模塊;所述源文檔信息抽取模塊用于從源文檔中抽取信息;所述基于目錄的粗粒度圖譜構建模塊用于分析文檔目錄結構,并以此構造樹狀知識圖譜;所述實體抽取模塊用于從文檔信息中抽取關鍵實體信息;所述知識圖譜構建子系統包括:關系挖掘與補全模塊、圖譜數據預處理模塊、知識圖譜插入模塊、知識圖譜可視化模塊,所述關系挖掘與補全模塊用于從文檔信息中抽取關鍵關系信息,并對缺失關系進行補全;所述圖譜數據預處理模塊用于實現圖譜數據的預處理,包括圖譜中節點的連接信息以及邊信息以及節點標識與節點名稱的映射信息;所述知識圖譜插入模塊用于構建知識圖譜,并將實體、關系插入到知識圖譜中;所述知識圖譜可視化模塊用于將知識圖譜可視化展示;所述知識查詢與問答子系統包括:問題答案生成模塊和候選答案排序及輸出模塊,所述問題答案生成模塊用于根據輸入問題,尋找和計算合適的候選答案;所述候選答案排序及輸出模塊用于從候選答案中找出置信度最高的答案進行輸出,實現對文檔知識的動態查詢與問答應對的智能處理;所述知識圖譜插入模塊將前序模塊中抽取到的實體和關系插入到知識圖譜中,具體包括下述步驟: 1)初始化知識圖譜 使用Cypher語句對圖譜進行初始化,其內容為清除知識圖譜中的所有實體和關系,并將維護的實體表和關系表進行清空; 2)實體節點插入: 使用Cypher語句將關系三元組中的實體進行插入,首先根據關系確定實體的類型,然后對其進行編號和命名,對于表格數據中的實體,將其各種屬性記錄到實體節點中,如果在插入過程中,遇到同名實體,則檢查其屬性信息是否完全相同,排除同一節點重復插入的可能; 3)實體間關系插入 使用Cypher語句將關系三元組中的關系進行插入,首先根據關系模板確定關系類型,然后建立關系結構,得到關系結構后根據其首尾實體的名稱,在知識圖譜中進行查詢,將查詢到的首尾實體和關系進行連接; 4)圖譜自糾錯 在插入實體和關系的過程中,圖譜會根據維護的實體表和關系表對插入數據進行糾錯,對于唯一性的實體,如出現重復插入的操作,系統則會報錯并根據實體表反饋重復的節點信息。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人華東師范大學,其通訊地址為:200241 上海市閔行區東川路500號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。