齊魯工業大學(山東省科學院);山東正晨科技股份有限公司焦成宇獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉齊魯工業大學(山東省科學院);山東正晨科技股份有限公司申請的專利基于四叉樹網格優化的深度圖像對齊方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120070527B 。
龍圖騰網通過國家知識產權局官網在2025-08-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510535831.7,技術領域涉及:G06T7/33;該發明授權基于四叉樹網格優化的深度圖像對齊方法是由焦成宇;高鶴;白凱月;韋凱;顏國翠;孫凱健;張書銳;鄭文靜;李軍設計研發完成,并于2025-04-27向國家知識產權局提交的專利申請。
本基于四叉樹網格優化的深度圖像對齊方法在說明書摘要公布了:本發明涉及深度圖像對齊技術領域,尤其是提供了一種基于四叉樹網格優化的深度圖像對齊方法。該方法包括通過網格生成模塊生成四叉樹動態網格及掩碼;基于四叉樹動態網格,設計深度圖像對齊網絡,使用像素級圖像對齊函數和網格約束損失函數進行優化;通過所述的深度圖像對齊網絡估計圖像的單應性變換和網格偏移參數;根據估計的單應性變換和網格偏移參數,對圖像依次進行單應性變換和網格偏移變換,在兩次圖像變換過程中,使用基于BiCubic函數的雙三次插值算法對網格進行平滑變換,該方法解決了復雜場景中圖像對齊的問題,克服了在處理復雜幾何變形和大視角變化時的不足。
本發明授權基于四叉樹網格優化的深度圖像對齊方法在權利要求書中公布了:1.一種基于四叉樹網格優化的深度圖像對齊方法,其特征在于,所述方法包括: 步驟1、通過網格生成模塊生成四叉樹動態網格及掩碼,所述網格生成模塊根據圖像特征點的分布密度調整四叉樹網格的細化程度; 步驟2、基于所述的四叉樹動態網格,設計深度圖像對齊網絡,使用像素級圖像對齊函數和網格約束損失函數進行優化;通過所述的深度圖像對齊網絡估計圖像的單應性變換和網格偏移參數; 步驟3、根據估計的單應性變換和網格偏移參數,對圖像依次進行單應性變換和網格偏移變換,在兩次圖像變換過程中,使用基于BiCubic函數的雙三次插值算法對網格進行平滑變換; 所述步驟1包括: 對于每一對待拼接的圖像,首先利用尺度不變特征轉換SIFT算法提取圖像中的特征點描述符di=(di1,di2,…,di128),其中每個描述符包括關鍵點在尺度空間內4×4窗口內計算的8個方向的梯度信息,生成一個128維的向量作為特征表征;獲取特征描述符后,采用暴力匹配的方式,計算參考圖像Ir中每個特征描述符dr與目標圖像It中所有描述符dt之間的相似度,其表達式為; ; 其中n=128;對于每一個特征點描述符,得到其最鄰近距離Dn和次鄰近距離Ds,通過計算最鄰近距離與次鄰近距離的比率r,當比率r小于閾值t時,為可信的匹配對;在此基礎上,利用四叉樹結構對特征描述符匹配對進行空間劃分,根據匹配點的分布密度,通過遞歸的方式,逐步細分網格空間,從而在圖像上形成四叉樹動態網格結構;遞歸細化的核心表達式為: ; 其中,表示第n個網格坐標,由網格的左上角坐標和右下角坐標組成,其表達式為: ; 表示細化后網格的坐標,其中每個坐標表示為: ; 其中,為網格的中心點,計算表達式為: ; 獲得四叉樹動態網格后,為其生成掩碼,包括: 以四叉樹動態網格中的最小網格為單位的生成均勻網格,通過以下公式生成一個預測掩碼: ; 其中,為與相對應的四叉樹動態網格點坐標,為四叉樹動態網格點集; 所述步驟2中對像素級圖像對齊函數像素一致性損失進行計算,令表示圖像的扭曲操作,Ir為參考圖像,It為目標圖像,Ⅱ為與Ir具有相同分辨率的全一矩陣,為單應性變換參數,為網格偏移參數;基于此,對齊損失定義為: 網格約束損失函數包括平滑損失和變形損失,其中,平滑損失用于控制網格的平滑程度;變形損失用于約束非重疊區域網格變形程度; 平滑損失表示為: ; 其中,表示水平或垂直相鄰點的余弦相似度,,分別表示水平和垂直方向的相鄰點數量; 變形損失可以表示為: ; 其中,是一個掩碼,表示哪些區域屬于非重疊區域;為非重疊區域網格偏移量; 所述步驟2中通過所述的深度圖像對齊網絡估計圖像的單應性變換和網格偏移參數包括:采用先粗后精的對齊策略,首先通過單應性變換進行粗對齊,然后利用四叉樹動態網格對進行精確對齊; 深度圖像對齊網絡的主干網絡對待拼接的兩張輸入圖像進行一個卷積操作,所述兩張輸入圖像的網絡權重共享,隨后通過四層HCS模塊提取圖像特征,每層濾波器大小為128、256、512、512,得到F12,F14,F18,F116,將F116輸入到一個SC模塊進行處理,之后進行上采樣并與F18進行拼接,得到F18’,其通道數為1536;然后,將F18’輸入一個HCS模塊得到的F18”,其通道數為1024,將其進行上采樣并與F14拼接得到F14’,其通道數為1280,再次輸入一個HCS模塊得到F14”,其通道數為512;深度圖像對齊網絡的預測網絡通過CCL層計算特征圖(Fr18”,Ft18”)之間的相關性,隨后使用一個包括三個全連接層的MLP頭估計單應性變換;通過得到的單應性變換參數對Ft14”進行變換,實現初步粗對齊,將Fr14”與變換后的Ft14”輸入第二個CCL層和MLP頭得到初預測值,通過與掩碼的Hadamard乘積操作,將初預測值映射到原始圖像的四叉樹動態網格中,得到四叉樹動態網格的網格偏移參數; 所述HCS模塊包括一個haar小波采樣層、一個C2f層和一個SCSA注意力層,每個濾波器對應的C2f層數為3、6、6、3;SC模塊包括一個SPPF層和一個CAM注意力機制層,SPPF層和CAM注意力機制層的輸出特征通過Concat拼接后輸出。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人齊魯工業大學(山東省科學院);山東正晨科技股份有限公司,其通訊地址為:250000 山東省濟南市長清區西部新城大學科技園;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。