浙江工業大學黃鐘汀獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉浙江工業大學申請的專利一種基于數據挖掘的高維劇場數據降維可視化處理方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114328663B 。
龍圖騰網通過國家知識產權局官網在2025-08-15發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202111616059.X,技術領域涉及:G06F16/2458;該發明授權一種基于數據挖掘的高維劇場數據降維可視化處理方法是由黃鐘汀;陳永毅;張丹設計研發完成,并于2021-12-27向國家知識產權局提交的專利申請。
本一種基于數據挖掘的高維劇場數據降維可視化處理方法在說明書摘要公布了:一種基于數據挖掘的高維劇場數據降維可視化處理方法,屬于劇場設備信息管理技術領域。它包括以下步驟:1、對高維劇場設備運行大數據進行降維處理;2、對異構數據的信息進行融合,并對融合的高維數據信息提取頻繁序列模式;3、對劇場設備運行數據進行聚類處理;4、訓練劇場設備運行數據向量,并根據詞向量構成句子向量進行文本分類,將優化后的向量在二維語義空間進行語義可視化表示。本發明通過對海量劇場設備高維數據進行降維處理,將相似的文本收斂到可處理的量級,同時結合相關的半監督學習以及隔離森林算法對降維數據文件進行分類,設計數據分類模型算法并進行可視化展示,優化劇場設備運維數據的管理,實現高效準確的運維。
本發明授權一種基于數據挖掘的高維劇場數據降維可視化處理方法在權利要求書中公布了:1.一種基于數據挖掘的高維劇場數據降維可視化處理方法,其特征在于,包括以下步驟: 1將多源異構劇場設備運行數據進行初步整理,針對其中的多源模糊沖突信息,基于不精確推理理論的隔離森林異常檢測分類技術和流形學習中的等距映射ISOMAP的非線性降維算法,在保持局部幾何特征的前提下,對高維劇場設備運行大數據進行降維處理; 2針對劇場設備運行數據的異構性和多源性,分別對異構數據的信息進行抽取融合、多源數據融合和沖突融合,對融合的高維數據信息提取頻繁序列模式,從日志信息中發現高維數據之間的關聯性,構建日志信息序列; 3基于深度學習以及半監督學習的日志分析方法,對劇場設備運行數據進行聚類處理:以等距映射算法為基礎,將相似度大于0.75的高維數據收斂到可處理的量級,同時結合相應的半監督學習以及深度學習方法對日志文件進行分類; 4使用Skip-gram模型來訓練劇場設備運行數據向量,并根據詞向量構成句子向量進行文本分類,以此來衡量詞向量的質量,優化訓練詞向量的迭代次數、維度以及調整訓練模型以及語料的大??;經過優化后的詞向量作為CNN模型的輸入,并在二維語義空間進行語義可視化表示; 所述步驟4的具體過程如下: 4.1、采用Skip-gram模型預測上下文目標詞,從而最大化整個語料庫∑w,c∈D∑wj∈ClogPwwj,其中,Pwwj表示通過softmax函數產生第w個單詞的多項式分布、wj表示詞序列[w1,w2,…,wj]、w為字典中的任意詞、c為w的上下文詞、D為從調度語料中抽取出的字典;模型每次從目標詞的上下文選擇n個詞,并將其詞向量映射到對應的TF-IDF向量作為模型的輸入; 4.2、采用Jaccard算法來計算日志信息的相似度:使用Jaccard距離進行預處理,將相似度小于0.25的日志數據篩選出去,接著再使用編輯距離進行判斷,從而實現對日志的聚類收斂,以及給所有數據賦值唯一的id。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人浙江工業大學,其通訊地址為:310006 浙江省杭州市拱墅區朝暉六區潮王路18號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。