中國科學院計算技術研究所黃慶明獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉中國科學院計算技術研究所申請的專利基于深度PU學習與類別先驗估計的數據分類方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114417975B 。
龍圖騰網通過國家知識產權局官網在2025-08-29發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202111591020.7,技術領域涉及:G06F18/2415;該發明授權基于深度PU學習與類別先驗估計的數據分類方法及系統是由黃慶明;趙昀睿;姜陽邦彥;許倩倩設計研發完成,并于2021-12-23向國家知識產權局提交的專利申請。
本基于深度PU學習與類別先驗估計的數據分類方法及系統在說明書摘要公布了:本發明提出一種基于基于深度PU學習與類別先驗估計的數據分類方法和系統,本發明能同時估計類別先驗,并利用所得先驗估計學習深度模型,而無需已知數據的真實先驗分布,從而更適用于PU學習在實際場景中的應用。本發明所提出的迭代框架包括將網絡的預測分數建模為GMM,從而估計正類先驗;基于正類先驗的估計值,進行無偏PU學習;進而結合半監督學習的平均教師、溫度銳化等技術,提高算法性能和穩定性。該框架能應用于包括計算機視覺、推薦系統、生物醫療等在內各領域的PU問題,并且效果優異,兼具科學價值和實用價值。
本發明授權基于深度PU學習與類別先驗估計的數據分類方法及系統在權利要求書中公布了:1.一種基于深度PU學習與類別先驗估計的數據分類方法,其特征在于,包括: 步驟1、獲取包括多個數據樣本的訓練集,且在該訓練集中只有部分數據樣本標有類別標簽,將該訓練集同時輸入至兩個網絡結構相同,但參數不同的學生模型和教師模型中,分別得到學生模型和教師模型輸出的各數據樣本對應的學生預測分數和教師預測分數; 步驟2、將所有教師預測分數輸入至高斯混合模型,得到正類先驗;基于所有學生預測分數,構建溫度銳化損失;基于所有學生預測分數和教師預測分數,構建一致性損失;基于該正類先驗和所有學生預測分數,得到非負PU風險,合并該一致性損失、該非負PU風險和該溫度銳化損失,得到目標損失,并基于該目標損失,使用梯度反向傳播對該學生模型的參數進行更新,直至該目標收斂或達到預設迭代次數,保存當前學生模型或老師模型作為數據分類模型; 步驟3、將待分類數據輸入至該數據分類模型,以得到該待分類數據的類別; 其中,當用于惡意URL檢測時,該訓練集中數據為部分已標注惡意類別的URL和無標簽的URL,且學生模型和教師模型均為循環神經網絡;當用于虛假評論檢測時,該訓練集中數據為已標注虛假類別的評論和無標簽的評論,且學生模型和教師模型均為循環神經網絡;當用于冷凍電鏡的粒子拾取時,該訓練集中數據為已標注選中類別的粒子區域和無標簽的粒子區域,且學生模型和教師模型均為卷積神經網絡。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人中國科學院計算技術研究所,其通訊地址為:100080 北京市海淀區中關村科學院南路6號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。