復旦大學金亦旻獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉復旦大學申請的專利面向數據湖中表數據的數據發現方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN117235090B 。
龍圖騰網通過國家知識產權局官網在2025-08-08發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202311252232.1,技術領域涉及:G06F16/24;該發明授權面向數據湖中表數據的數據發現方法是由金亦旻;楊衛東設計研發完成,并于2023-09-26向國家知識產權局提交的專利申請。
本面向數據湖中表數據的數據發現方法在說明書摘要公布了:本發明提供了一種面向數據湖中表數據的數據發現方法,具有這樣的特征,包括以下步驟:步驟S1,構建表的索引;步驟S2,根據索引檢索并計算關聯表的相關性數據;步驟S3,根據所有相關性數據構建得到多個相關子圖;步驟S4,將相關子圖轉化為第一虛擬文檔;步驟S5,計算第一相似度;步驟S6,構建初篩圖;步驟S7,對所有初篩圖進行合并得到合并圖;步驟S8,將合并圖轉化為第二虛擬文檔;步驟S9,計算第二相似度;步驟S10,構建復篩圖;步驟S11,通過成本函數對n個復篩圖對應的所有相關子圖進行相關度排序,將排序后的相關子圖作為檢索結果。總之,本方法能夠根據檢索關鍵字檢索得到更加準確的檢索結果。
本發明授權面向數據湖中表數據的數據發現方法在權利要求書中公布了:1.一種面向數據湖中表數據的數據發現方法,用于根據查詢關鍵字從數據湖的所有表中得到檢索結果,其特征在于,包括以下步驟: 步驟S1,對每個所述表,從所述表中提取名稱、值、格式、詞嵌入和領域分布作為該表的索引; 步驟S2,根據所述索引檢索并計算存在關聯的兩個表之間的關聯程度作為這兩個表的相關性數據; 步驟S3,根據所有所述相關性數據構建得到多個相關子圖; 步驟S4,通過拓撲語義集合器TSA將所述相關子圖轉化為對應的虛擬文檔作為第一虛擬文檔; 步驟S5,通過BM25函數計算得到各個所述第一虛擬文檔和所述查詢關鍵字之間的相似度作為第一相似度; 步驟S6,將所有所述第一相似度從大到小排序,選取前m個所述第一相似度對應的所述相關子圖作為初篩圖; 步驟S7,通過歸并函數對所有所述初篩圖進行合并,得到多個合并圖; 步驟S8,通過拓撲語義集合器TSA將所述合并圖轉化為對應的虛擬文檔作為第二虛擬文檔; 步驟S9,通過BM25函數計算得到各個所述第二虛擬文檔和所述查詢關鍵字之間的相似度作為第二相似度; 步驟S10,將所有所述第二相似度從大到小排序,選取前n個所述第二相似度對應的所述合并圖作為復篩圖; 步驟S11,通過成本函數對n個所述復篩圖對應的所有所述相關子圖進行相關度排序,將排序后的所述相關子圖作為所述檢索結果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人復旦大學,其通訊地址為:200433 上海市楊浦區邯鄲路220號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。