華東師范大學;上海嗨普智能信息科技股份有限公司魏森輝獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉華東師范大學;上海嗨普智能信息科技股份有限公司申請的專利基于變分自編碼器、無監督聚類算法和聯邦學習的數據生成方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115238908B 。
龍圖騰網通過國家知識產權局官網在2025-08-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210251482.2,技術領域涉及:G06N20/00;該發明授權基于變分自編碼器、無監督聚類算法和聯邦學習的數據生成方法是由魏森輝;高明;蔡文淵;杜蓓;劉翔設計研發完成,并于2022-03-15向國家知識產權局提交的專利申請。
本基于變分自編碼器、無監督聚類算法和聯邦學習的數據生成方法在說明書摘要公布了:本發明公開了一種基于變分自編碼器、無監督聚類算法和聯邦學習的數據生成方法,該方法通過聯邦學習架構共同訓練每個本地客戶端的變分自編碼器,并且針對不同客戶端數據域的差異,提出利用無監督聚類算法來對不同客戶端進行分組,然后在每個簇內單獨進行聯邦學習模型訓練,很大程度上緩解了數據域差異給聯邦模型訓練帶來的危害,最終每個組可以訓練得到一個全局生成模型。在預測階段就可以利用訓練好的全局生成模型產生更多安全的共享的數據,為更多機器學習和深度學習任務提高有效的數據支撐。
本發明授權基于變分自編碼器、無監督聚類算法和聯邦學習的數據生成方法在權利要求書中公布了:1.一種基于變分自編碼器、無監督聚類算法和聯邦學習的數據生成方法,其特征在于,按如下步驟進行數據生成: 模型訓練階段 步驟S1:在聯邦學習每一輪的通信過程中,中央服務器從所有本地客戶端中隨機選擇比例為K1的本地客戶端,然后將中央服務器的編碼器參數發送給被選中的本地客戶端,用于更新其編碼器參數;其中K1的選擇范圍是10%-50%; 步驟S2:被選中的本地客戶端利用本地訓練集進行生成模型變分自編碼器的訓練,定義均方誤差損失函數以及KL散度作為優化目標,使用梯度下降作為優化方法,迭代地訓練本地模型; 步驟S3:本地訓練結束后,被選中的客戶端通過網絡通信傳輸的方式,將本地變分解碼器中的編碼器參數上傳到中央服務器; 步驟S4:中央服務器聚合從本地客戶端上傳的編碼器參數,更新中央服務器的編碼器參數; 步驟S5:重復步驟S1-步驟S4,直到所有本地客戶端都至少被中央服務器選擇3-5次,將當前中央服務器的編碼器參數發送給所有客戶端,本地客戶端編碼器更新參數; 步驟S6:每個本地模型通過編碼器將自己的原始數據映射到低維空間上,并且在這個低維空間上利用無監督聚類算法K-means++進行聚類,得到G1個組,對每個組的低維向量取平均值,然后將得到低維向量上傳到中央服務器;其中G1為3-5; 步驟S7:中央服務器在接收到所有本地客戶端發送過來的低維向量后,利用無監督聚類算法K-means++進行聚類,將所有低維向量分成G2個組,將屬于某個客戶端的低維向量最多的組作為該客戶端被分到的組;其中G2為4-8; 步驟S8:在完成對本地客戶端分組后,在每個組內獨立地進行聯邦學習模型訓練; 步驟S9:每個組內的客戶端在每一輪通信過程中,當前組的中央服務器從當前組的所有本地客戶端中隨機選擇比例為K2的本地客戶端,然后將當前組的中央服務器的編碼器和解碼器參數發送給被選中的本地客戶端,更新其編碼器和解碼器參數;其中K2的選擇范圍是40%-80%; 步驟S10:每個組內被選中的客戶端,進行同步驟S2的本地模型訓練; 步驟S11:每個組內被選中的客戶端通過網絡通信傳輸的方式,將本地變分自解碼器中的編碼器和解碼器的參數上傳到當前組的中央服務器; 步驟S12:每個組內的中央服務器聚合從本地客戶端上傳的編碼器和解碼器參數,更新當前組中央服務器的編碼器和解碼器參數; 步驟S13:重復步驟S9-步驟S12,直到每個組的模型收斂或達到固定的通信輪數,停止訓練,每個組得到一個最終的全局生成模型; 模型預測階段 步驟S14:從標準正態分布中采集Ns個隨機樣本,其中,Ns根據具體業務場景調整; 步驟S15:每個組的客戶端利用全局生成模型的解碼器,將隨機樣本映射成逼真的安全的共享的數據。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人華東師范大學;上海嗨普智能信息科技股份有限公司,其通訊地址為:200241 上海市閔行區東川路500號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。