蘇州元腦智能科技有限公司孫京本獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉蘇州元腦智能科技有限公司申請的專利重復數據檢測方法、設備、存儲介質及計算機程序產品獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120296008B 。
龍圖騰網通過國家知識產權局官網在2025-08-22發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510771673.5,技術領域涉及:G06F16/215;該發明授權重復數據檢測方法、設備、存儲介質及計算機程序產品是由孫京本;任健;孫昊設計研發完成,并于2025-06-10向國家知識產權局提交的專利申請。
本重復數據檢測方法、設備、存儲介質及計算機程序產品在說明書摘要公布了:本申請公開了一種重復數據檢測方法、設備、存儲介質及計算機程序產品,涉及數據處理技術領域,通過多個預設函數與已存儲數據塊構建預設位數組,作為待檢測數據塊的數據重復檢測的基礎,通過預設位數組初步篩選出可能重復的待檢測數據塊,再對于可能重復的待檢測數據塊通過預設哈希表進行進一步精細化檢測,從而實現數據的分層檢測,相對于全部待檢測數據塊的哈希查表遍歷比對,有效提升檢測效率,同時保證檢測的準確性。
本發明授權重復數據檢測方法、設備、存儲介質及計算機程序產品在權利要求書中公布了:1.一種重復數據檢測方法,其特征在于,包括: 基于多個預設哈希函數分別對至少一個已存儲數據塊的哈希值進行哈希計算,確定所述至少一個已存儲數據塊對應的多個第一目標元素位的地址; 將預設位數組中的所述多個第一目標元素位置為非空值; 基于所述多個預設哈希函數分別對待檢測數據塊的哈希值進行哈希計算,確定所述待檢測數據塊對應的多個第二目標元素位的地址; 若所述預設位數組中的所述多個第二目標元素位不存在空值,則根據預設哈希表確定所述待檢測數據塊是否為重復數據塊; 其中,所述根據預設哈希表確定所述待檢測數據塊是否為重復數據塊,包括: 在所述預設哈希表中查找與所述待檢測數據塊的哈希值相同的目標數據塊; 對所述待檢測數據塊以及所述目標數據塊進行比對,得到比對結果; 根據所述比對結果,確定所述待檢測數據塊是否為重復數據塊; 所述對所述待檢測數據塊以及所述目標數據塊進行比對,得到比對結果,包括: 在所述待檢測數據塊與所述目標數據塊中進行第二滑動窗口的移動,實時計算每次窗口移動操作對應的待檢測特征值以及目標特征值,所述待檢測特征值為所述待檢測數據塊中所述第二滑動窗口內的數據特征值,所述目標特征值為所述目標數據塊中所述第二滑動窗口內的數據特征值; 對比同一窗口移動操作對應的所述待檢測特征值以及所述目標特征值,得到所述比對結果; 所述在所述待檢測數據塊與所述目標數據塊中進行第二滑動窗口的移動,實時計算每次窗口移動操作對應的待檢測特征值以及目標特征值,包括: 在預設數據塊中進行第二滑動窗口的移動,確定單次移動過程中所述第二滑動窗口中的移除字符與新增字符,所述預設數據塊為所述待檢測數據塊或所述目標數據塊; 根據所述移除字符的哈希貢獻以及所述新增字符,對第一窗口哈希值進行更新,得到第二窗口哈希值,所述第一窗口哈希值為單次移動操作前的所述第二滑動窗口內數據的哈希值,所述第二窗口哈希值為所述單次移動操作后的所述第二滑動窗口內數據的哈希值; 所述根據所述移除字符的哈希貢獻以及所述新增字符,對第一窗口哈希值進行更新,得到第二窗口哈希值,包括: 將基礎值與所述移除字符相乘,得到所述移除字符的哈希貢獻,所述基礎值是基于哈希函數的基數、模數、所述第二滑動窗口的窗口大小計算得到的; 確定所述第一窗口哈希值與所述移除字符的哈希貢獻的差值,計算所述差值與所述基數的乘積; 基于所述模數對所述乘積與所述新增字符之和進行取模,得到第二窗口哈希值; 所述根據所述比對結果,確定所述待檢測數據塊是否為重復數據塊,包括: 若至少一次窗口移動操作對應的所述待檢測特征值與所述目標特征值不同,則確定所述待檢測數據塊與所述目標數據塊不重復; 否則,則確定所述待檢測數據塊與所述目標數據塊重復。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人蘇州元腦智能科技有限公司,其通訊地址為:215000 江蘇省蘇州市吳中經濟開發區綜保區經一路1號8幢;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。