南京航空航天大學李博涵獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉南京航空航天大學申請的專利一種多源跨域數據查詢方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119691003B 。
龍圖騰網通過國家知識產權局官網在2025-08-15發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510206906.7,技術領域涉及:G06F16/2453;該發明授權一種多源跨域數據查詢方法及系統是由李博涵;吳文隆;文浩;王昊奮;尹海蓮;李靜波;卓俊男;趙鑫喆;劉元睿設計研發完成,并于2025-02-25向國家知識產權局提交的專利申請。
本一種多源跨域數據查詢方法及系統在說明書摘要公布了:本發明屬于信息檢索技術領域,公開了一種多源跨域數據查詢方法及系統。本發明方法包括如下步驟:首先利用大語言模型進行數據識別、提取、分類,構建多源知識圖譜;其次基于大語言模型進行多源跨域數據的深度聚合和重構,得到同源知識線圖;緊接著根據查詢需求進行查詢節點與所屬子圖的置信度計算,剔除低質量節點,從知識圖譜中提取可信候選子圖,以保證多域檢索查詢結果有效;最后將篩選出的可信候選子圖嵌入提示詞模板,利用垂直大模型進行數據查詢。本發明基于大語言模型的多源知識融合和查詢方法,將不同來源中的跨域數據進行整合形成領域知識,利用垂直大模型實現多源跨域數據的精準高效查詢。
本發明授權一種多源跨域數據查詢方法及系統在權利要求書中公布了:1.一種多源跨域數據查詢方法,其特征在于,包括如下步驟: 步驟1.檢索領域中的不同來源、不同存儲形式的多源跨域數據,并利用大語言模型進行數據的識別、提取以及分類,構建多源知識圖譜; 多源跨域數據類型包括結構化表格、半結構化XML文檔以及非結構化文本;分別采用不同的數據轉化解析器,對每一種不同的數據類型進行數據解析; 步驟2.對多源知識圖譜進行重構和聚合,將零散分布于多源知識圖譜中的各個具有相似語義的節點進行合并與重組,得到同源知識線圖; 將步驟1中利用大語言模型進行提取得到的實體和關系,通過文本相似度模型對不同數據源中相同或相似實體進行匹配和對齊、以及對實體間關系進行梳理和融合,得到聚合的同源數據組,基于同源數據組構建同源知識線圖,過程如下: 步驟2.1.對未訪問節點集合、同源數據組以及孤立點集進行初始化處理,包括初始化未訪問節點集合unvisited={V},同源數據集合孤立點集 步驟2.2.遍歷未訪問節點集合中的每一個節點,針對當前遍歷到的節點A,初始化用于存儲同源節點的集合、邊的集合以及同源節點的相關變量;再次遍歷未訪問節點集合中除節點A外的其他節點B,當判斷節點A與其他節點B滿足同源關系時,則執行以下操作: 將滿足同源關系的當前節點A和其他節點B分別加入到同源節點集Usg和邊集Esg;并且將當前節點A、其他節點B從未訪問節點集合中移除,以避免重復訪問和處理; 步驟2.3.在完成對某一節點的同源節點和邊集的確定后,進行如下判斷: 若同源節點集Usg為空集,則將當前節點A加入到孤立點集中,作為獨立于同源數據組之外的特殊數據點進行單獨管理;若同源節點集Usg不為空集,則將同源節點集Usg以及與之對應的邊集Esg整體作為一個同源數據組SV,加入到同源數據集合SVs中; 步驟2.4.重復步驟2.2和步驟2.3,未訪問節點集合中的所有節點均被遍歷和處理完畢,完成整個同源知識圖的構建過程,最終輸出同源數據集合SVs和孤立點集 步驟2.5.對于同源數據集合SVs中的每個同源數據組SVi,其中包含的同源節點集Usg和同源邊集Esg構成同源線性子圖 將所有的同源線性子圖和孤立點集進行聚合,得到同源知識線圖 步驟3.依據查詢需求,利用大語言模型在同源知識線圖內進行查詢節點的置信度得分,并計算對應同源線性子圖的源可信度閾值,篩選與查詢相關的可信候選子圖; 通過互信息熵的置信度計算方法計算實體節點的置信度,綜合考慮節點來源的可靠性、節點權威性及歷史權威性因素,使用概率統計模型和大語言模型進行計算評分; 步驟4.將篩選出的可信候選子圖的核心內容和關鍵關聯信息嵌入提示詞模板,隨后利用垂直大模型篩選出與查詢意圖高度匹配的數據結果,作為數據查詢結果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人南京航空航天大學,其通訊地址為:210016 江蘇省南京市秦淮區御道街29號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。