南方科技大學(xué);華為技術(shù)有限公司李淑嫻獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉南方科技大學(xué);華為技術(shù)有限公司申請的專利一種基于集成學(xué)習(xí)和樣本重要性的模型訓(xùn)練方法及系統(tǒng)獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN115063623B 。
龍圖騰網(wǎng)通過國家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-08-08發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號(hào)為:202210446487.0,技術(shù)領(lǐng)域涉及:G06V10/764;該發(fā)明授權(quán)一種基于集成學(xué)習(xí)和樣本重要性的模型訓(xùn)練方法及系統(tǒng)是由李淑嫻;宋麗妍;姚新;張曉明;武曉宇;胡崢設(shè)計(jì)研發(fā)完成,并于2022-04-26向國家知識(shí)產(chǎn)權(quán)局提交的專利申請。
本一種基于集成學(xué)習(xí)和樣本重要性的模型訓(xùn)練方法及系統(tǒng)在說明書摘要公布了:本發(fā)明公開了一種基于集成學(xué)習(xí)和樣本重要性的模型訓(xùn)練方法及系統(tǒng),方法包括:在模型訓(xùn)練前,獲取訓(xùn)練樣本,并基于訓(xùn)練樣本所對(duì)應(yīng)的類別信息,確定訓(xùn)練樣本所對(duì)應(yīng)的不平衡因子;獲取訓(xùn)練樣本的密度信息,并基于密度信息,確定訓(xùn)練樣本所對(duì)應(yīng)的密度因子;在模型訓(xùn)練過程中,基于子分類器,確定訓(xùn)練樣本被分到各個(gè)類別的概率,并基于訓(xùn)練樣本被分到各個(gè)類別的概率確定樣本的邊界因子;基于不平衡因子、密度因子以及邊界因子,確定訓(xùn)練樣本的樣本重要性信息,并將樣本重要性信息融入集成學(xué)習(xí)的模型訓(xùn)練中,以完成模型訓(xùn)練。本發(fā)明可使得模型在訓(xùn)練過程中更關(guān)注小類樣本、分布在主要區(qū)域的樣本以及分類難度更高的樣本,以提高模型預(yù)測的性能。
本發(fā)明授權(quán)一種基于集成學(xué)習(xí)和樣本重要性的模型訓(xùn)練方法及系統(tǒng)在權(quán)利要求書中公布了:1.一種基于集成學(xué)習(xí)和樣本重要性的模型訓(xùn)練方法,其特征在于,所述方法包括: 在模型訓(xùn)練前,獲取訓(xùn)練樣本,并基于所述訓(xùn)練樣本所對(duì)應(yīng)的類別信息,確定所述訓(xùn)練樣本所對(duì)應(yīng)的不平衡因子,所述不平衡因子用于反映所述訓(xùn)練樣本所對(duì)應(yīng)的類別信息的類別大小與最小類別信息的類別大小之間的比值,所述訓(xùn)練樣本為圖像樣本; 獲取所述訓(xùn)練樣本的密度信息,并基于所述密度信息,確定所述訓(xùn)練樣本所對(duì)應(yīng)的密度因子,所述密度信息用于反映訓(xùn)練樣本與各臨近樣本之間的距離關(guān)系,所述各臨近樣本為與所述訓(xùn)練樣本屬于同一類別信息,所述密度因子通過指數(shù)形式將所述密度信息標(biāo)準(zhǔn)化在一定范圍內(nèi),且與密度信息成反比,用于反應(yīng)類內(nèi)分布信息; 在模型訓(xùn)練過程中,基于子分類器,確定所述訓(xùn)練樣本被分到各個(gè)類別的概率,并基于所述訓(xùn)練樣本被分到各個(gè)類別的概率確定所述訓(xùn)練樣本的邊界因子,所述邊界因子用于反映所述訓(xùn)練樣本被分到正確類別的概率與被分到錯(cuò)誤類別的最大概率之間差值,其中,所述訓(xùn)練樣本被分到正確類別的概率與被分到錯(cuò)誤類別的最大概率之間的差值為邊界值,將所述邊界值加1得到所述邊界因子; 基于所述不平衡因子、所述密度因子以及所述邊界因子,更新所述訓(xùn)練樣本的樣本重要性信息,并將所述樣本重要性信息融入集成學(xué)習(xí)的模型訓(xùn)練中,以完成模型訓(xùn)練; 所述基于所述密度信息,確定所述訓(xùn)練樣本所對(duì)應(yīng)的密度因子,包括: 獲取數(shù)據(jù)集的樣本平均密度; 計(jì)算所述訓(xùn)練樣本的密度信息與所述數(shù)據(jù)集的樣本平均密度之間的比值,得到樣本標(biāo)準(zhǔn)化密度; 根據(jù)所述樣本標(biāo)準(zhǔn)化密度,得到所述密度因子; 所述密度因子定義為以下指數(shù)形式: , 為訓(xùn)練樣本的標(biāo)準(zhǔn)化密度,為訓(xùn)練樣本的標(biāo)準(zhǔn)化密度,訓(xùn)練樣本屬于第類,為第類的大小; 所述基于所述不平衡因子、所述密度因子以及所述邊界因子,更新所述訓(xùn)練樣本的樣本重要性信息的公式為: , 其中,表示訓(xùn)練樣本的不平衡因子,表示訓(xùn)練樣本的密度因子,表示訓(xùn)練樣本在第t個(gè)訓(xùn)練周期的邊界因子。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人南方科技大學(xué);華為技術(shù)有限公司,其通訊地址為:518055 廣東省深圳市南山區(qū)桃源街道學(xué)苑大道1088號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 三星顯示有限公司文在晳獲國家專利權(quán)
- 安費(fèi)諾有限公司喬斯·里卡多·帕尼亞瓜獲國家專利權(quán)
- 上海治臻新能源裝備有限公司姜天豪獲國家專利權(quán)
- 廈門弘信電子科技集團(tuán)股份有限公司包克兵獲國家專利權(quán)
- 廣西路建工程集團(tuán)有限公司張坤球獲國家專利權(quán)
- 中國平安人壽保險(xiǎn)股份有限公司李國文獲國家專利權(quán)
- 北京字節(jié)跳動(dòng)網(wǎng)絡(luò)技術(shù)有限公司張莉獲國家專利權(quán)
- 三星電子株式會(huì)社崔在薰獲國家專利權(quán)
- 青島海爾智能技術(shù)研發(fā)有限公司胡燦獲國家專利權(quán)
- 海寧美惠機(jī)械有限公司孫夕啟獲國家專利權(quán)