南京郵電大學霍智勇獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉南京郵電大學申請的專利一種基于自注意力神經網絡的單目圖像深度估計算法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115115685B 。
龍圖騰網通過國家知識產權局官網在2025-08-19發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210634004.X,技術領域涉及:G06T7/50;該發明授權一種基于自注意力神經網絡的單目圖像深度估計算法是由霍智勇;陳奕杭設計研發完成,并于2022-06-07向國家知識產權局提交的專利申請。
本一種基于自注意力神經網絡的單目圖像深度估計算法在說明書摘要公布了:本發明公開了一種基于自注意力神經網絡的單目圖像深度估計算法,本方法中對單目圖像進行低級特征預處理,利用自注意力神經網絡建立遠距離連接,對圖像低級特征進行高級特征編碼,快速獲得圖像全局信息,同時采用一種token注意力增強自注意力網絡特征表達能力,最后將低級特征與高級特征進行特征融合并進行深度信息解碼,針對不同場景的深度范圍的尺度差異以及深度圖邊緣模糊等問題,本發明采用一種尺度不變損失和邊緣梯度不變損失函數監督網絡學習仿射不變性深度信息。本發明可以快速生成深度信息準確、邊緣清晰的深度圖。
本發明授權一種基于自注意力神經網絡的單目圖像深度估計算法在權利要求書中公布了:1.一種基于自注意力神經網絡的單目圖像深度估計算法,其特征在于:包括如下步驟: 步驟1:獲取參與訓練的多種不同場景的深度數據集; 步驟2:對步驟1中的深度數據集中的真實值進行域統一,并且通過正則化對所有真實值進行尺度縮放; 步驟3:將訓練數據集中的圖像送入圖片預處理網絡,生成低級圖像特征; 步驟4:將步驟3中的低級圖像特征送入自注意力神經網絡進行高級特征提取; 步驟4中接收步驟3中的圖像特征進行特征編碼的自注意力神經網絡包含12層,每層均包括多頭自注意力網絡、多層感知器、層歸一化,層與層之間進行串聯,并在其中數層中添加token注意力; 在自注意力神經網絡第3、6、9和第12層嵌入token注意力,將token向量進行多頭注意力計算前,對token向量分別進行最大池化和平均池化操作,然后通過多層感知器得到相應的池化token向量,然后相加并利用sigmoid函數對處理后的token向量進行權重計算,得到TAI,并將其與輸入token向量I進行相乘計算; token注意力表達式如下: ; 其中MLP為多層感知器,MaxPool為最大池化層,AvgPool為平均池化層,sigmoid為激活函數; 步驟5:將步驟3和步驟4提取的圖像特征送入特征融合模塊進行特征融合,并送入深度信息解碼器,獲得網絡預測深度值; 步驟6:利用最小二乘算法對步驟5預測的深度值與步驟2預處理的真實值進行尺度匹配,得到尺度因子與平移因子; 步驟7:利用步驟6獲得的尺度因子與平移因子對網絡預測值進行尺度變換,并通過尺度不變損失函數和邊緣梯度不變損失函數計算損失,進行網絡反向傳播,得到訓練好的且優化損失為全局最小值的網絡; 步驟8:將單張任意圖片輸入到步驟7訓練好的網絡生成對應的深度信息圖。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人南京郵電大學,其通訊地址為:210046 江蘇省南京市棲霞區文苑路9號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。