石家莊鐵道大學張云佐獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉石家莊鐵道大學申請的專利一種融合跨模態語義信息的視頻摘要方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120126056B 。
龍圖騰網通過國家知識產權局官網在2025-08-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510248933.0,技術領域涉及:G06V20/40;該發明授權一種融合跨模態語義信息的視頻摘要方法是由張云佐;肖遙舸;連瑋琪;董彥磊;程煜;康堯星設計研發完成,并于2025-03-04向國家知識產權局提交的專利申請。
本一種融合跨模態語義信息的視頻摘要方法在說明書摘要公布了:本發明公開了一種融合跨模態語義信息的視頻摘要方法,屬于計算機視覺技術領域。所述方法首先從輸入視頻中提取圖像幀序列和運動幀序列,然后利用跨模態特征提取網絡分別提取靜態特征和動態特征。接著,通過時空卷積關聯注意力機制處理幀特征,生成反映幀特征時空重要性的注意力圖,同時捕捉幀內空間信息和幀間時間信息。此外,引入跨模態動態融合模塊和語義一致性校正器,以優化視頻摘要生成過程,減少噪聲干擾,提升摘要質量。最后,構建目標函數,通過無監督或監督學習訓練視頻摘要生成模型,根據預測的重要性分數生成動態視頻摘要。所述方法綜合利用視頻中的靜態和動態特征,提高了摘要的語義準確性和內容連貫性。
本發明授權一種融合跨模態語義信息的視頻摘要方法在權利要求書中公布了:1.一種融合跨模態語義信息的視頻摘要方法,其特征在于,包括以下步驟: S1:讀取輸入視頻,提取用于表示靜態視覺內容的圖像幀序列,以及反映動態運動狀態變化的運動幀序列; S2:通過跨模態特征提取網絡分別提取視頻幀的靜態特征和動態特征,所述跨模態特征提取網絡包括時間流網絡和空間流網絡,空間流網絡用于提取靜態特征,時間流網絡用于提取動態特征; 所述空間流網絡用于提取反映視頻幀中物體類別、場景語義及視覺內容的靜態語義特征;所述時間流網絡用于提取動態特征,包括提取運動RGB特征和光流特征兩種動態特征,所述運動RGB特征用于捕捉場景切換及動態目標的顏色變化,所述光流特征用于描述幀間運動方向與速度; S3:通過時空卷積關聯注意力機制生成時空重要性注意力圖; 所述時空卷積關聯注意力機制用于融合幀內的空間信息和幀間的時間信息,生成反映幀特征時空重要性的注意力圖;首先將空間流和時間流提取的特征進行堆疊,形成二維結構的幀特征表示;將空間流的靜態特征和時間流的動態特征沿著特征維度進行拼接,得到高維的幀特征表示;然后利用卷積神經網絡對堆疊后的幀特征進行處理;卷積神經網絡能夠同時捕捉幀內的空間信息和幀間的時間信息,生成反映幀特征時空重要性的注意力圖,注意力圖的每個元素表示對應幀特征的重要性;注意力圖用于后續的特征加權和重要性分數預測; S4:引入跨模態動態融合模塊,根據當前幀的語義特征動態調整靜態與動態模態的權重比例,并生成融合跨模態語義的混合特征表示; S5:引入語義一致性校正器,優化跨模態特征與靜態特征之間的語義一致性; S6:構建目標函數,訓練視頻摘要生成模型,并根據模型預測的重要性分數生成視頻摘要。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人石家莊鐵道大學,其通訊地址為:050043 河北省石家莊市長安區北二環東路17號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。