云南大學夏躍龍獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉云南大學申請的專利一種基于空時網絡聚類約簡集成的極端多標簽學習方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114676252B 。
龍圖騰網通過國家知識產權局官網在2025-08-19發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210260959.3,技術領域涉及:G06F16/353;該發明授權一種基于空時網絡聚類約簡集成的極端多標簽學習方法是由夏躍龍;楊云設計研發完成,并于2022-03-16向國家知識產權局提交的專利申請。
本一種基于空時網絡聚類約簡集成的極端多標簽學習方法在說明書摘要公布了:本發明公開了多標簽文本挖掘技術領域的一種基于空時網絡聚類約簡集成的極端多標簽學習方法,包括以下步驟:空時網絡注意力集成表征;自適應標簽關系增強和聚類約簡學習;加權的約簡標簽集不平衡學習;本發明集成了多標簽文本中詞、短語、標簽三者之間交互注意力,探索了詞、短語、標簽之間的依賴關系,有效提升了極端多標簽文本表征能力;提出自適應標簽關系增強和聚類約簡學習機制,通過自適應標簽關系增強,能有效挖掘標簽之間的依賴關系,提升模型的泛化性,通過聚類約簡學習,能有效將不同量級標簽適應現有模型進行訓練;提出加權的約簡標簽集不平衡學習機制,解決了標簽稀疏和不平衡帶來的模型泛化性、可擴展性差等問題。
本發明授權一種基于空時網絡聚類約簡集成的極端多標簽學習方法在權利要求書中公布了:1.一種基于空時網絡聚類約簡集成的極端多標簽學習方法,其特征在于,包括以下步驟: S1、空時網絡注意力集成表征;具體步驟為: S11、原始極端多標簽數據獲取;針對實際不同應用場景獲取的極端多標簽數據進行學習; S12、短語級表征CNN和詞級表征RNN;給定文檔表示對短語級表征,使用CNN卷積核和偏差項bi學習ω-grams短語級的表征,讓向量ci表示詞ei-ω+1,...,ei的聯合,則特征pi表示為:pi=δConv1DWi,ci+bi;對詞級表征,使用RNN學習雙向的詞級信息,表示為: S13、空間語義信息表征;通過混合的注意力機制,包括卷積多頭自注意力模塊和卷積交互注意力模塊,最終得到空間語義信息表征,該表征考慮短語與短語關系,以及短語與標簽之間的關系; S14、時序語義信息表征;使用混合的注意力機制捕捉時序的語義信息表征,包括循環的自注意力模塊和循環的交互注意力模塊; S15、空時網絡注意力集成表征;基于S13獲得的和基于S14獲得的提出一種自適應加權集成策略,首先使用l2標準化和然后通過一個MLP層和全連接層轉換其到權重和表示為:最后通過標準化權重獲得最后的空時網絡注意力集成表征,描述為: M=α×C+β×R,獲得空時網絡注意力集成表征M; S2、自適應標簽關系增強和聚類約簡學習;具體步驟為: S21、標簽樹聚類;通過將包含有標簽的稀疏文本特征和該標簽文本特征進行內積求和,標準化得到每個標簽的特征表示,然后使用平衡k-means,k=2進行遞歸的聚類,迭代直到滿足如下條件:給定每個簇的最大標簽量,要求將標簽劃分到S個簇中,每個標簽簇中包含的標簽量滿足小于最大標簽量或者大于最大標簽量的一半;當得到S個簇時候,基于S1模塊得到的表征M,則通過一個全連接層映射M到S維的向量P; S22、標簽關系增強;通過傳達標簽關系在原生的預測P基礎上增加一個bottleneck層來自適應實現標簽增強,形式化描述為: S23、聚類約簡學習;基于S21標簽樹聚類得到的S個簇索引表示為yS∈{0,1}S,和標簽關系增強得到的表征提出一種自適應聚類約簡學習機制,描述為: S3、加權的約簡標簽集不平衡學習;具體步驟為: S31、約簡標簽集嵌入;基于S21得到的k個簇,得到標簽的約簡集U,基于S1得到的表征M,得到一個約簡的標簽集嵌入向量Q,描述為:Q=σWQM+bQ; S32、加權的不平衡學習;基于S21得到的k個簇,得到標簽的約簡集U,同時找到這些標簽真實所對應的標簽yU∈{0,1}U;采用加權的不平衡損失進行學習,描述為: 其中是約簡標簽集U中樣本對應的真實標簽,Qk是使用S31得到的嵌入,γ+和γ-表達了不同正負樣本權重的貢獻,通常情況下,γ->γ+,通常設置γ+為0,γ-為1; 整體模型訓練描述為:
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人云南大學,其通訊地址為:650091 云南省昆明市五華區翠湖北路2號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。