中電信無人科技(江蘇)有限公司羅前春獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉中電信無人科技(江蘇)有限公司申請的專利一種基于深度學習跨模態技術的無人機視頻檢索方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120316305B 。
龍圖騰網通過國家知識產權局官網在2025-08-15發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510774162.9,技術領域涉及:G06F16/78;該發明授權一種基于深度學習跨模態技術的無人機視頻檢索方法是由羅前春;楊垠彬;單海峰;余曉龍;孫井花;李響;范沐陽;陳美設計研發完成,并于2025-06-11向國家知識產權局提交的專利申請。
本一種基于深度學習跨模態技術的無人機視頻檢索方法在說明書摘要公布了:本發明公開了一種基于深度學習跨模態技術的無人機視頻檢索方法,包括:根據用戶輸入的文本,進行初步分類,獲取待檢測的時間、地點、對象和目的;從時間、地點、對象三個維度對原始視頻進行預篩選,得到可能的關鍵幀和包含檢測對象的目標框;根據改進后的VIT模型對文本和預篩選的關鍵幀進行精準匹配,得到準確圖片幀;搭建基于GRU?CRF的神經網絡,根據待檢測的目的調整GRU網絡的步長,對準確圖片幀進行處理,將屬于同一個視頻片段的圖片幀歸類,得到符合用戶要求的視頻片段。本發明從四個維度的信息抽取關鍵幀和對圖片幀進行分類,極大地縮短了視頻檢索時長,提高了視頻檢索效率和準確性。
本發明授權一種基于深度學習跨模態技術的無人機視頻檢索方法在權利要求書中公布了:1.一種基于深度學習跨模態技術的無人機視頻檢索方法,其特征在于,所述方法包括以下步驟: S1,對檢索文本進行特征向量化處理,將檢索文本轉換為高維向量;根據用戶輸入的文本,進行初步分類,獲取待檢測的時間、地點、對象和目的; S2,根據視頻連續幀變換、無人機飛行參數和用戶輸入的檢索文本中提煉出的檢測對象信息,從時間、地點、對象三個維度對原始視頻進行預篩選,得到可能的關鍵幀和包含檢測對象的目標框; S3,通過步驟S2得到的目標框對VIT模型進行改進,并根據改進后的VIT模型對文本和預篩選的關鍵幀進行精準匹配,得到準確圖片幀; S4,搭建基于GRU-CRF的神經網絡,根據步驟S1獲取的待檢測的目的調整GRU網絡的步長,采用基于GRU-CRF的神經網絡對步驟S3得到的準確圖片幀進行處理,將屬于同一個視頻片段的圖片幀歸類,得到符合用戶要求的視頻片段;步驟S4進一步包括: 分析檢測目標,明確其對應的時間需求細粒度及事件特征;依據時間需求細粒度,設定GRU網絡的步長,將準確圖片幀輸入GRU網絡,通過GRU網絡的時序建模能力,輸出不同時段且帶有相應事件特征標簽的圖片幀序列,完成初步的時序特征提取與事件標簽標注; 將帶有相應事件特征標簽的圖片幀序列導入CRF模型,由CRF模型基于圖片幀間的上下文關聯以及標簽間的依賴關系,結合不同時間點的場景變化、動作延續性因素,計算事件開始、事件進行中、事件結束這三個不同時間標簽在整個圖片幀序列上的聯合概率; 基于聯合概率判斷事件持續時間是否符合預設的時間需求,并輸出每個圖片幀對應的特征表示與標簽信息,優化事件時序分析結果; 按照視頻原始時序,將屬于同一視頻片段的圖片幀進行歸類整合,得到包含檢測目的對應事件、主題或屬性的視頻片段,對視頻內容進行結構化提取與劃分。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人中電信無人科技(江蘇)有限公司,其通訊地址為:211000 江蘇省南京市建鄴區江心洲賢坤路5號5棟智立方G座;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。