南京郵電大學張偉獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉南京郵電大學申請的專利基于內容查詢和位置查詢的人物交互檢測方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119693762B 。
龍圖騰網通過國家知識產權局官網在2025-08-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510207309.6,技術領域涉及:G06V10/80;該發明授權基于內容查詢和位置查詢的人物交互檢測方法是由張偉;吳帆;陳云芳設計研發完成,并于2025-02-25向國家知識產權局提交的專利申請。
本基于內容查詢和位置查詢的人物交互檢測方法在說明書摘要公布了:本申請適用于人物交互檢測技術領域,提供了一種基于內容查詢和位置查詢的人物交互檢測方法,包括:首先通過主干網絡提取圖像特征,并用目標檢測器DETR檢測人和物體實例,然后配對人物與物體實例,提取外觀、空間和物體類別語義特征并計算交互性分數,選出交互提議,接著將多模態特征深度融合,生成內容和位置嵌入,傳入Transformer解碼器進行交叉注意力計算,得到交互特征,最后將交互特征輸入分類器,結合置信度分數,輸出人物交互三元組的分數。該方法通過深度融合多模態特征和交叉注意力機制,有效提高人物與物體交互的檢測精度,能夠準確識別復雜場景中的人物交互關系。
本發明授權基于內容查詢和位置查詢的人物交互檢測方法在權利要求書中公布了:1.一種基于內容查詢和位置查詢的人物交互檢測方法,其特征在于,包括如下步驟: S1、將待檢測圖像輸入至主干網絡中得到圖像視覺特征,將其展平為多個一維向量,經過正弦位置編碼增強,傳入目標檢測器DETR得到所有人實例和物體實例; S2、將人實例和物體實例一一配對獲取多個人物對,提取人物對的多模態特征,所述多模態特征包括外觀特征、空間特征及物體類別語義特征,將所述外觀特征、所述空間特征及所述物體類別語義特征進行連接并傳入多層感知機得到每個人物對的交互性分數,將分數最高的多個人物對確定為多個人物交互提議; S3、對S2中提取的人物對的多模態特征進行深度融合得到人物交互提議的內容嵌入,并利用人框和物體框的中心點坐標構建人物交互提議的位置嵌入; S4、將多個人物交互提議的內容嵌入和位置嵌入傳入預設的Transformer解碼器,生成內容查詢和位置查詢,并與圖像特征、圖像位置編碼進行解耦式的交叉注意力計算,得到交互特征; S5、將交互特征傳入動作分類器,得到每個動作類別的分數,結合S1得到的人實例和物體實例的置信度分數得到人物交互三元組的分數; 所述S3的方法具體如下: S301、對于每個人物交互提議,利用S2提取的人物對的多模態特征構建內容嵌入ec,方法如下: fas=MBFfa,fs fpair=MBFfas,fc ec=fpair 其中fa代表人物對的外觀特征,fs代表人物對的空間特征,fc代表人物對的物體類別語義特征,MBF代表多分支融合模塊; S302、對于每個人物交互提議,利用人框和物體框的中心點坐標構建位置嵌入ep,方法如下: ep=[φxh+φxo;φyh+φyo] 其中xh,yh為人框中心點的坐標,xo,yo為物體框中心點的坐標,φ·的作用是將標量映射到正弦嵌入空間,計算方式為其中i=1,2,3,...,d2。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人南京郵電大學,其通訊地址為:210003 江蘇省南京市鼓樓區新模范馬路66號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。