山東大學劉寧獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉山東大學申請的專利基于自訓練的面向生物醫學信號的數據擴增方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119719869B 。
龍圖騰網通過國家知識產權局官網在2025-08-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510213166.X,技術領域涉及:G06F18/24;該發明授權基于自訓練的面向生物醫學信號的數據擴增方法及系統是由劉寧;姜超英;辛玉晶;劉磊;崔立真設計研發完成,并于2025-02-26向國家知識產權局提交的專利申請。
本基于自訓練的面向生物醫學信號的數據擴增方法及系統在說明書摘要公布了:本發明屬于數據處理技術領域。提出了一種基于自訓練的面向生物醫學信號的數據擴增方法及系統,根據任一條預處理后的真實樣本以及預訓練的擴散模型,得到此條真實樣本對應的多個擴增樣本;計算該條真實樣本與各個擴增樣本的相似度,根據相似度選擇與該條真實樣本最相似的一條唯一擴增樣本,計算所有條真實樣本對應的擴增樣本;根據擴增樣本以及基于真實樣本初步訓練的下游模型,計算擴增樣本的偽標簽,根據偽標簽與真實標簽的對比,以標簽一致的唯一擴增樣本為最終擴增樣本。本發明解決了生物醫學信號數據量不足、多樣性不足以及數據和標簽噪聲等問題,顯著提升了下游模型的性能。
本發明授權基于自訓練的面向生物醫學信號的數據擴增方法及系統在權利要求書中公布了:1.一種基于自訓練的面向生物醫學信號的數據擴增方法,其特征在于,包括以下過程: 對多條真實生物醫學樣本信號進行預處理,得到預處理后的多條真實樣本; 根據任一條所述真實樣本以及預訓練的擴散模型,得到此條所述真實樣本對應的多個擴增樣本; 計算該條所述真實樣本與各個所述擴增樣本的相似度,根據所述相似度選擇與該條所述真實樣本最相似的一條唯一擴增樣本,計算所有條所述真實樣本對應的唯一擴增樣本; 根據所述唯一擴增樣本以及基于所述真實樣本初步訓練的下游模型,計算擴增樣本的偽標簽,根據所述偽標簽與真實標簽的對比,以標簽一致的唯一擴增樣本為最終擴增樣本; 計算該條所述真實樣本與各個所述擴增樣本的相似度,根據所述相似度選擇與該條所述真實樣本最相似的一條唯一擴增樣本,包括: 分別計算該條所述真實樣本的二維嵌入和各個擴增樣本的二維嵌入之間的余弦相似度; 根據所述余弦相似度的值進行排序,如果任一個所述余弦相似度的值大于設定閾值,則選擇所述余弦相似度的值最高的擴增樣本作為該條所述真實樣本的唯一擴增樣本; 如果所述余弦相似度的值均小于或等于設定閾值,則對該條所述真實樣本重新生成多個擴增樣本,并重新選擇最相似的唯一擴增樣本,直至完成選擇; 預訓練的擴散模型中,采用帶有注意力機制的Transformer模型學習逆向分布,用于預測每一個時間步添加的噪聲量; 采用各條所述真實樣本構成的真實訓練集進行下游模型的訓練,得到初步訓練的下游模型;根據所述初步訓練的下游模型以及所述唯一擴增樣本,得到所述擴增樣本的偽標簽,保留偽標簽與所述真實樣本的真實標簽相同的唯一擴增樣本;將被保留的所有唯一擴增樣本與所有真實樣本繼續作為下游模型的訓練數據進行所述下游模型的訓練,通過循環迭代,不斷篩選出具有高置信度標簽的樣本,將其加入到下游模型的訓練中,直至滿足所述下游模型的訓練精度要求。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人山東大學,其通訊地址為:250000 山東省濟南市高新區舜華路1500號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。