湖南大學張輝獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉湖南大學申請的專利一種基于注意力機制的物體6D位姿估計方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120318325B 。
龍圖騰網通過國家知識產權局官網在2025-08-22發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510780227.0,技術領域涉及:G06T7/73;該發明授權一種基于注意力機制的物體6D位姿估計方法及系統是由張輝;孔垂旺;陳為立;陳波;李康;樊葉心;江一鳴;王耀南設計研發完成,并于2025-06-12向國家知識產權局提交的專利申請。
本一種基于注意力機制的物體6D位姿估計方法及系統在說明書摘要公布了:本發明涉及計算機視覺技術領域,具體為一種基于注意力機制的物體6D位姿估計方法及系統;物體6D位姿估計方法中利用了6D位姿估計網絡,6D位姿估計網絡包括目標檢測模塊、主干網絡模塊和位姿預測模塊。在目標檢測模塊中,根據目標所在位置對RGB圖像進行放大處理。主干網絡模塊采用全新ResNet變體,整合了像素級小波多分支注意力機制與雙通道上采樣注意力機制,實現對目標在空間域和小波域中多尺度特征的高效捕捉與融合。位姿預測模塊則利用神經網絡直接預測6D位姿。本發明不僅為提升遮擋魯棒性提供了創新思路,更構建了一種基于空頻域特征融合的端到端物體6D位姿估計新范式。
本發明授權一種基于注意力機制的物體6D位姿估計方法及系統在權利要求書中公布了:1.一種基于注意力機制的物體6D位姿估計方法,其特征在于,包括如下步驟: S1、搭建6D位姿估計網絡,6D位姿估計網絡包括目標檢測模塊、主干網絡模塊和位姿預測模塊,主干網絡模塊內嵌像素級小波多分支注意力機制和雙通道上采樣注意力機制;將數據集劃分為訓練集和測試集; S2、從訓練集選擇一張RGB圖像輸入到目標檢測模塊中,識別RGB圖像內預定的目標物體,將包含目標物體在內的RGB圖像局部放大至固定尺寸,得到目標物體放大圖像,并輸出目標物體的2D像素坐標圖; S3、將目標物體放大圖像輸入到主干網絡模塊中,得到目標物體的表面區域注意力圖、物體坐標圖和掩碼圖,然后將物體坐標圖和目標物體的2D像素坐標圖進行拼接,得到密集對應關系圖; S4、將表面區域注意力圖和密集對應關系圖拼接后輸入到位姿預測模塊中,得到目標物體預測的6D位姿信息; S5、依據目標物體預測的6D位姿信息、真實的6D位姿信息、表面區域注意力圖、物體坐標圖以及掩碼圖構建總損失函數,循環S2至S5,最小化總損失函數,直至總損失函數收斂,得到訓練后的6D位姿估計網絡; S6、利用測試集對訓練后的6D位姿估計網絡進行測試,得到物體6D位姿信息; 所述像素級小波多分支注意力機制的數據處理步驟具體如下: A1、將輸入特征沿著輸入通道分為兩部分,分別為空間域特征和特征; A2、對特征進行離散小波變換得到小波域特征; A3、小波域特征經過一個的卷積層和激活函數得到特征圖; A4、將特征圖輸入到多分支位置注意力機制中,得到特征圖,特征圖經過卷積層和激活函數,得到位置特征; A5、小波域特征經過一個的卷積層和激活函數得到特征圖; A6、將特征圖輸入到與多分支位置注意力機制并行設置的多分支通道注意力機制中,得到特征圖,特征圖經過卷積層和激活函數,得到通道特征; A7、將位置特征和通道特征相加得到特征,特征經過一個的卷積層和激活函數得到特征; A8、對特征使用逆小波變換,得到特征,然后將空間域和特征進行拼接并且通過一個的卷積層和激活函數,得到融合特征; A9、輸入特征通過一個的卷積層之后再與融合特征相加,得到輸出特征。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人湖南大學,其通訊地址為:410082 湖南省長沙市岳麓區麓山南路1號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。