安徽凌坤智能科技有限公司年四成獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉安徽凌坤智能科技有限公司申請的專利一種基于中位值注意力殘差網絡的豬臉識別方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115188029B 。
龍圖騰網通過國家知識產權局官網在2025-08-08發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210953320.3,技術領域涉及:G06V40/10;該發明授權一種基于中位值注意力殘差網絡的豬臉識別方法是由年四成;陶松兵;何啟航;劉金珠;張慶文;胡杰杰;吳學棟設計研發完成,并于2022-08-09向國家知識產權局提交的專利申請。
本一種基于中位值注意力殘差網絡的豬臉識別方法在說明書摘要公布了:本發明公開了一種基于中位值注意力殘差網絡的豬臉識別方法,屬于模式識別技術領域,該發明方法通過訓練集對中位值注意力殘差網絡進行反復的迭代訓練,得到具有最佳識別性能的豬臉識別模型,并使用其對待識別的豬臉圖像實現豬臉識別。本發明方法引入注意力機制到殘差網絡中,其中,注意力機制的數據壓縮方法采取中位值壓縮,得到更好的通道描述符,并賦予不同通道更精準的權值。本發明的方法在測試集上有著很好的識別正確率,均高于傳統的分類方法。因此,能很好解決目前豬臉識別中存在的問題,適應實際的應用。
本發明授權一種基于中位值注意力殘差網絡的豬臉識別方法在權利要求書中公布了:1.一種基于中位值注意力殘差網絡的豬臉識別方法,其特征在于,包括通過訓練中位值注意力殘差網絡得到具有最優識別性能的豬臉識別模型,并利用該豬臉識別模型實現豬臉圖像的識別,具體包括以下步驟: 步驟1,構建豬臉識別的訓練集和測試集 采集M類豬臉圖片,其中M記為豬臉的類別數; 對M類豬臉圖片的每個類別隨機挑選A張豬臉圖片,獲得M×A張豬臉圖片,然后對M×A張豬臉圖片采用B種圖像預處理方式進行圖像增強,并保留每種圖像處理方式得到的豬臉圖像,即共得到A×M×B+1張豬臉圖片,該A×M×B+1張豬臉圖片組成訓練集; 在M類豬臉圖片的每類中另外挑選C張豬臉圖片,獲得M×C張豬臉圖片,該M×C張豬臉圖片組成測試集,A≠C; 步驟2,訓練中位值注意力殘差網絡得到最優分類效果模型,并將最優分類效果模型記為豬臉識別模型,具體步驟如下: 步驟2.1,選取殘差網絡ResNet50作為主干網絡,在主干網絡中加入基于中位值壓縮的注意力機制,賦予不同通道權值對通道值進行校正,得到中位值注意力殘差網絡,并記為MAM_ResNet50; 所述MAM_ResNet50的結構包括:一個卷積矩陣大小為7×7、卷積步距為2、通道數為64的卷積層Ω1,一個卷積矩陣大小為3×3、卷積步距為2的最大池化層Λ1,一個由3個相同的中位值注意力殘差結構1沿MAM_ResNet50輸入-輸出方向串聯得到的一級中位值注意力殘差單元Φ1,一個由4個相同的中位值注意力殘差結構2沿MAM_ResNet50輸入-輸出方向串聯得到的二級中位值注意力殘差單元Φ2,一個由6個相同的中位值注意力殘差結構3沿MAM_ResNet50輸入-輸出方向串聯得到的三級中位值注意力殘差單元Φ3,一個由3個相同的中位值注意力殘差結構4沿MAM_ResNet50輸入-輸出方向串聯得到的四級中位值注意力殘差單元Φ4,一個全局平均池化層Λ2; MAM_ResNet50的輸入依次為卷積層Ω1、最大池化層Λ1、一級中位值注意力殘差單元Φ1、二級中位值注意力殘差單元Φ2、三級中位值注意力殘差單元Φ3、四級中位值注意力殘差單元Φ4和全局平均池化層Λ2; 所述中位值注意力殘差結構1沿MAM_ResNet50輸入-輸出方向依次由以下三個卷積層串聯得到:卷積矩陣大小為1×1通道數為64的卷積層,卷積矩陣大小為3×3通道數為64的卷積層,卷積矩陣大小為1×1通道數為256的卷積層,在卷積矩陣大小為1×1通道數為256的卷積層后插入基于中位值壓縮的注意力機制; 中位值注意力殘差結構2沿MAM_ResNet50輸入-輸出方向依次由以下三個卷積層串聯得到:卷積矩陣大小為1×1通道數為128的卷積層,卷積矩陣大小為3×3通道數為128的卷積層,卷積矩陣大小為1×1通道數為512的卷積層,在卷積矩陣大小為1×1通道數為512的卷積層后插入基于中位值壓縮的注意力機制; 中位值注意力殘差結構3沿MAM_ResNet50輸入-輸出方向依次由以下三個卷積層串聯得到:卷積矩陣大小為1×1通道數為256的卷積層,卷積矩陣大小為3×3通道數為256的卷積層,卷積矩陣大小為1×1通道數為1024的卷積層,在卷積矩陣大小為1×1通道數為1024的卷積層后插入基于中位值壓縮的注意力機制; 中位值注意力殘差結構4沿MAM_ResNet50輸入-輸出方向依次由以下三個卷積層串聯得到:卷積矩陣大小為1×1通道數為512的卷積層,卷積矩陣大小為3×3通道數為512的卷積層,卷積矩陣大小為1×1通道數為2048的卷積層,在卷積矩陣大小為1×1通道數為2048的卷積層后插入基于中位值壓縮的注意力機制; 將基于中位值壓縮的注意力機制插入前的卷積層的通道數記為δ,δ或等于256或等于512或等于1024或等于2048; 步驟2.2,利用訓練集對步驟2.1所述的MAM_ResNet50進行優化,具體步驟如下: 步驟2.2.1,采用圖像歸一化處理方式,將訓練集中的所有豬臉圖像的像素統一調整為I×I; 步驟2.2.2,隨機選取訓練集中的J張豬臉圖像,并將其中任意一個豬臉圖像的序號記為x,x=1,2,...,J,將第x張豬臉圖像的真實one-hot編碼序列記為Hx,其中,q為真實one-hot編碼序列Hx中每個真實one-hot編碼值的序號,q=1,2,...,M,表示序號為x的豬臉圖像在真實one-hot編碼序列Hx中的第q個真實one-hot編碼值; 真實one-hot編碼序列Hx的取值定義為:令且此時 中的其他真實one-hot編碼值均等于0; 步驟2.2.3,將步驟2.2.2選取得到的J張豬臉圖像輸入MAM_ResNet50,輸出每張豬臉圖像的預測one-hot編碼序列Xx,其中p為預測one-hot編碼序列Xx中每個預測one-hot編碼值的序號,p=1,2,...,M,表示序號為x的豬臉圖像在預測one-hot編碼序列Xx中的第p個預測one-hot編碼值; 步驟2.2.4,根據真實one-hot編碼序列Hx與預測one-hot編碼序列Xx,通過反向傳播操作,對MAM_ResNet50的網絡權重進行更新優化,具體方式如下: 計算真實one-hot編碼序列Hx與預測one-hot編碼序列Xx之間的損失函數loss,其中,||·||2表示歐幾里得范數; 通過梯度下降法最小化損失函數loss,反向傳播更新神經網絡元之間連接的權重,完成此次MAM_ResNet50的訓練; 步驟2.2.5,重復步驟2.2.2至步驟2.2.4,直至訓練集中所有豬臉圖像都被選取過;其中,如果最后一輪選取中,訓練集剩下的豬臉圖像數小于J,則從已經選取過的豬臉圖像中隨機選取豬臉圖像進行補充; 將通過步驟2.2.2到步驟2.2.5完成訓練的MAM_ResNet50稱為第L輪的MAM_ResNet50,并記為網絡TL,其中L為輪數的序號,L=i,2,…G,G為重復次數; 步驟2.3,通過測試集,計算網絡TL對測試集分類的正確率PL, 為網絡TL對測試集中豬臉圖像分類正確的數值, 步驟2.4,G次重復步驟2.2至步驟2.3,得到一個網絡集合T和一個正確率集合P,T={T1,T2,...,TL,...,TG},P={P1,P2,...,PL,...,PG}; 步驟2.5,在正確率集合P中取最大的正確率值記為最大正確率Pmax,在網絡集合T中取最大正確率Pmzx對應的MAM_ResNet50網絡作為具有最優識別性能的MAM_ResNet50網絡,并記為豬臉識別模型; 步驟3,通過豬臉識別模型實現豬臉識別,具體步驟如下: 步驟3.1,將待識別豬臉圖像輸入至豬臉識別模型,豬臉識別模型對待識別豬臉圖像進行特征提取并生成待識別豬臉圖像特征序列K,其中K=k1,k2,...,kw,...,kZ,w表示待識別豬臉圖像特征序列的維數,kw表示第w維待識別豬臉圖像特征序列的值,w=1,2,...,Z; 步驟3.2,取kτ=max{k1,k2,...,kw,...,kZ},τ對應的待識別豬臉圖像特征序列K的維數即為待識別豬臉的類別數,kτ的數值為該類別數的置信度。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人安徽凌坤智能科技有限公司,其通訊地址為:233000 安徽省蚌埠市蚌山區姜橋路心里程產業園7號廠房;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。