杭州安恒信息技術股份有限公司黃旗亮獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉杭州安恒信息技術股份有限公司申請的專利網站聚類方法、系統、計算機設備和存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114912524B 。
龍圖騰網通過國家知識產權局官網在2025-08-15發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210520075.7,技術領域涉及:G06F18/23;該發明授權網站聚類方法、系統、計算機設備和存儲介質是由黃旗亮;宓晨希設計研發完成,并于2022-05-13向國家知識產權局提交的專利申請。
本網站聚類方法、系統、計算機設備和存儲介質在說明書摘要公布了:本申請涉及一種網站聚類方法、系統、計算機設備和存儲介質,其中,該方法包括:對待聚類網站進行解析,得到對應的DOM樹結構;提取DOM樹結構的各類節點,根據DOM樹結構的各類節點得到相應的匹配向量;基于匹配向量對待聚類網站進行聚類,得到聚類結果。通過本申請,解決了大量網站頁面聚類時,相似度計算復雜的問題,實現了通過計算匹配向量的方案替代現有技術中通過復雜算法進行DOM樹相似度計算方法,能夠適用于大體量級的網站聚類問題,并且提高了聚類效率。
本發明授權網站聚類方法、系統、計算機設備和存儲介質在權利要求書中公布了:1.一種網站聚類方法,其特征在于,包括: 采集待聚類網站,并對所述待聚類網站進行解析,得到對應的DOM樹結構; 提取所述DOM樹結構的根節點和二級節點的標簽名稱,并按提取順序依次拼接得到第一節點字符串;對所述第一節點字符串進行哈希運算,得到基礎框架匹配向量; 提取所述DOM樹結構的最終節點的標簽名稱,并按提取順序依次拼接得到第二節點字符串;對所述第二節點字符串進行哈希運算,得到全局框架匹配向量; 基于所述基礎框架匹配向量,在比對所述基礎框架匹配向量完全一致的情況下進行聚類,以將所述待聚類網站按照網站框架分類聚類,得到初步聚類結果; 在所述初步聚類結果中,基于所述全局框架匹配向量,聚類得到最終聚類結果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人杭州安恒信息技術股份有限公司,其通訊地址為:310051 浙江省杭州市濱江區西興街道聯慧街188號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。