杭州電子科技大學佘青山獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉杭州電子科技大學申請的專利一種基于RGB圖像的輕量化三維手部姿態估計方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115880724B 。
龍圖騰網通過國家知識產權局官網在2025-08-15發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202211628762.7,技術領域涉及:G06V40/10;該發明授權一種基于RGB圖像的輕量化三維手部姿態估計方法是由佘青山;陳炫琦;馬玉良;席旭剛設計研發完成,并于2022-12-17向國家知識產權局提交的專利申請。
本一種基于RGB圖像的輕量化三維手部姿態估計方法在說明書摘要公布了:本發明涉及一種基于RGB圖像的輕量化三維手部姿態估計方法,首先,使用多個sandglass殘差塊串聯堆疊,用于進行局部的特征建模。其次,在部分sandglass殘差塊之后,對特征進行“展開”操作,并以Transformer塊結構進行全局的特征建模,再對特征進行“折疊”,并進行特征融合。然后,在Transformer塊中引入可分離自注意力機制,降低自注意力的計算復雜度。最后,將特征圖通過卷積得到二維手部姿態熱圖,兩者拼接后通過卷積得到關節向量圖,再次拼接后再通過卷積得到三維手部姿態熱圖,最終實現三維手部姿態估計。本發明從RGB圖像中直接估計三維手部姿態,并且能夠在具有較高的估計精度的同時保持優良的計算效率,能夠在人機交互、虛擬現實、手勢識別等領域具有廣闊的應用前景。
本發明授權一種基于RGB圖像的輕量化三維手部姿態估計方法在權利要求書中公布了:1.一種基于RGB圖像的輕量化三維手部姿態估計方法,其特征在于:包括以下步驟: 步驟一:將多個sandglass殘差塊串聯堆疊,保證卷積所具有的歸納偏置特性,用于局部的特征建模; 所述步驟一具體包括: 引入了sandglass殘差塊結構,其中主分支中的第一個和最后一個卷積層是保留通道數不變的深度可分離卷積層,模擬經典的瓶頸塊結構,在兩個深度可分離卷積之間使用兩個連續的逐點卷積堆疊,先減少后再增加通道數,因為1×1的逐點卷積會導致空間信息的減弱,將兩個3×3的卷積置于兩個1×1的卷積之外,并適當地將兩個深度可分離卷積應用到更高維度的特征上,從而可以對更豐富的空間信息進行編碼,以生成更具表現力的空間信息, 表示輸入特征,表示輸出特征,采用如下公式表示: 其中,φi,p,φi,d分別表示第i個逐點卷積與深度卷積,確保深度卷積在高維空間處理并得到更豐富的特征表達; 步驟二:對特征進行“展開”操作,再以Transformer塊結構進行全局的特征建模,再對特征進行“折疊”,并進行特征融合; 所述步驟二具體包括: 將sandglass塊輸出作為d維的輸入特征應用一個n×n標準卷積層,再用1×1的點卷積層產生特征XL,讓模型具有空間歸納偏置的全局表示,將特征XL展開為N個不重疊的patch,用表示,P=wh,而是patch的數量,h≤n和w≤n分別是patch的高度和寬度,根據式3,對于每個patch,即p∈{1,···,P},通過Transformer對patch間的關系進行編碼從而得到 XGp=TransformerXUp,1≤p≤P3 可以折疊得到使用逐點卷積將XF投影到低維空間,并通過級聯操作與特征X組合,使用另一個n×n卷積層來融合這些連接的特征,對特征XUp使用卷積對n×n區域的局部信息進行編碼,XGp對第p個位置的patch的全局信息進行編碼,XG中的每個像素都可以編碼來自X中所有像素的信息,總的有效感受野為H×W; 步驟三:在用于全局特征建模的Transformer塊中引入可分離自注意力機制,降低自注意力的計算復雜度; 所述步驟三具體包括: 可分離自注意力的結構與Transformer中使用的多頭自注意力類似,將Transformer的輸入Xinput分別使用輸入I、鍵K和值V三個分支處理,輸入分支I使用具有權重WI的線性層將Xinput中的每個d維token映射為標量,權重WI用來表示潛在token與Xinput間的距離,從而產生一個k維向量,然后使用softmax函數以產生上下文分數與針對所有k個token計算每個token的注意力分數不同,可分離自注意力僅計算關于潛在token的注意力分數,這樣可以使得計算注意力分數的時間復雜度從Ok2下降到Ok; 由式4,上下文向量Cv通過上下文分數Cs得到,其中由具有權重的鍵分支K將輸入Xinput線性投影到d維空間后得到, Cv中編碼的上下文信息與Xinput中的所有token共享,使用權重為WV的值分支V將輸入Xinput線性投影到d維空間然后使用ReLU激活函數后產生輸出將得到的輸出饋送到具有權重的另一個線性層后產生最終輸出 步驟四:將特征圖通過卷積得到二維手部姿態熱圖,兩者拼接后通過卷積得到關節向量圖,再次拼接后再通過卷積得到三維手部姿態熱圖,最終實現三維手部姿態估計。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人杭州電子科技大學,其通訊地址為:310018 浙江省杭州市錢塘新區白楊街道2號大街1158號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。