東北大學韓東紅獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉東北大學申請的專利一種面向社交網絡的興趣社群發現方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN110457477B 。
龍圖騰網通過國家知識產權局官網在2025-08-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:201910734196.X,技術領域涉及:G06F18/23213;該發明授權一種面向社交網絡的興趣社群發現方法是由韓東紅;楊樂;李洛妮;王志瑞;喬白友;劉晨設計研發完成,并于2019-08-09向國家知識產權局提交的專利申請。
本一種面向社交網絡的興趣社群發現方法在說明書摘要公布了:本發明提供一種面向社交網絡的興趣社群發現方法,涉及社區發現技術領域,本發明在傳統TextCNN模型基礎上建立新的深度學習模型,能夠支持多篇社交網絡文本輸入,并結合社交網絡文本間的相似度,提出了基于TextCNN結合相似度的多文本興趣建模方法,并提出了結合網絡結構和互動行為的用戶興趣特征建模方法。利用LM神將網絡算法構建用戶影響力模型,再根據該模型結果、關注關系以及@行為信息對基于SMB?TextCNN的結果進行調整,最后根據SIBUIM的結果,提出了基于k?means重疊的興趣社區發現方法。該方法考慮了社交網絡的結構性以及節點的內容,并且能夠對新浪微博用戶進行重疊的興趣社區劃分。
本發明授權一種面向社交網絡的興趣社群發現方法在權利要求書中公布了:1.一種面向社交網絡的興趣社群發現方法,其特征在于:包括以下步驟: 步驟1:將TextCNN卷積神經網絡模型的單文本輸入改為多文本輸入,并利用TextCNN卷積神經網絡生成用戶的興趣特征矩陣,利用每個用戶多個社交網絡文本之間的文本相似度對得到的興趣特征矩陣進行調整; 步驟1.1:讀取同一用戶ID的多篇社交網絡文本,利用python語言實現的中文分詞模塊結巴分詞中的精確模式對該用戶的多篇社交網絡文本進行分詞; 步驟1.2:使用word2vec模型中的CBOW,即ContinuousBag-of-WordsModel訓練模型對分詞結果進行向量化; 步驟1.3:將所述步驟1.2得到的詞向量輸入到TextCNN卷積神經網絡模型中,經過卷積層,池化層,全連接層操作后,得到該用戶的網絡社交文本興趣特征矩陣T={I1,I2,…IN}T; 步驟1.4:利用余弦相似性計算該用戶每篇網絡社交文本之間的文本相似性,將得到的網絡社交文本相似性作為權重對網絡社交文本興趣特征矩陣進行調整; 步驟2:用LM神經網絡算法構建用戶影響力模型,將用戶影響力分為高、較高、中、低四個等級,再根據用戶影響力模型結果、用戶關注關系以及@行為信息對基于TextCNN的結果進行調整; 步驟2.1:抽取社交網絡平臺的用戶的粉絲數、發表文本數、點贊數、評論數、轉發數作為影響力模型的特征,將相同ID的用戶數據進行合并; 步驟2.2:采用所述步驟2.1得到的用戶數據對LM神經網絡分類器進行訓練驗證,將用戶影響力分為高、較高、中、低四個等級; 步驟2.3:采用所述步驟2.2中訓練的LM神經網絡分類器對用戶ui的關注者列表構成的關注者集合UFi進行影響力的分類,并從中選取影響力類別為高的用戶構成集合HFi; 步驟2.4:分別計算用戶ui與集合HFi中所有用戶的社交網絡文本之間的相似性,利用得到的文本相似性調整所述步驟1.4得到的興趣特征矩陣; 步驟2.5:計算用戶ui的@列表構成的@用戶集合P中元素的興趣矩陣,并計算其興趣矩陣與ui的興趣矩陣的相似性,并用得到的結果對所述步驟2.4得到的興趣特征矩陣進行調整,得到最終的興趣特征矩陣Fi; 步驟3:基于k-means均值聚類的思想,利用興趣特征矩陣Fi對社交網絡平臺用戶進行重疊社區的發現和劃分; 步驟3.1:計算每個用戶興趣特征矩陣中的每個興趣類別上各元素的和,興趣類別第k列各元素的和記為Sumik,所有用戶在興趣類別k上Sumk的值記為Yk={Sum1k,Sum2k,…Sumzk}; 步驟3.2:興趣類別的Y構成的集合為L={Y1,Y2,…Ym},對集合L中每個元素內部進行k-means算法,即社區構成的集合記為集合C,將Yk內部進行社區劃分的結果按照各社區質心的位置從高到低排序,記為{Ck1,Ck2,Cka}; 步驟3.3:設每個興趣社區下有y個小社區,這y個小社區分別代表每個興趣類別下的興趣社區的分布狀況,因此對L中每個元素取前y個社區作為本方法在每個類別上社區劃分結果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人東北大學,其通訊地址為:110819 遼寧省沈陽市和平區文化路3號巷11號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。