騰訊科技(深圳)有限公司劉文然獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉騰訊科技(深圳)有限公司申請的專利模型訓練方法、視頻分類方法、裝置、設備及存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114780794B 。
龍圖騰網通過國家知識產權局官網在2025-08-15發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210273217.4,技術領域涉及:G06V20/40;該發明授權模型訓練方法、視頻分類方法、裝置、設備及存儲介質是由劉文然;譙睿智;朱允全設計研發完成,并于2022-03-18向國家知識產權局提交的專利申請。
本模型訓練方法、視頻分類方法、裝置、設備及存儲介質在說明書摘要公布了:本申請提供了一種模型訓練方法、視頻分類方法、裝置、設備及存儲介質,該方法包括獲取第一視頻、第一視頻的分類標注和標題信息;對第一視頻進行幀采樣得到第一視頻的至少一個視頻幀;對第一視頻的至少一個視頻幀分別進行文字識別得到至少一個視頻幀各自的文本信息;對至少一個視頻幀各自的文本信息進行處理得到第一視頻的第一詞向量,對第一視頻的標題信息進行處理,得到第一視頻的第二詞向量;根據第一視頻的第一詞向量、第二詞向量和至少一個視頻幀訓練視頻分類模型。由于文本信息可以更好的反映視頻內容,從而使得經過視頻幀的文本信息、視頻幀和視頻的標題信息訓練的視頻分類模型更佳,進而可以提高視頻分類精度。
本發明授權模型訓練方法、視頻分類方法、裝置、設備及存儲介質在權利要求書中公布了:1.一種模型訓練方法,其特征在于,包括: 獲取第一視頻、所述第一視頻的分類標注和所述第一視頻的標題信息; 對所述第一視頻進行幀采樣,得到所述第一視頻的至少一個視頻幀; 對所述第一視頻的至少一個視頻幀分別進行文字識別,得到所述至少一個視頻幀各自的文本信息; 對所述至少一個視頻幀各自的文本信息進行處理,得到所述第一視頻的第一詞向量,并對所述第一視頻的標題信息進行處理,得到所述第一視頻的第二詞向量; 根據所述第一視頻的第一詞向量、第二詞向量和所述至少一個視頻幀訓練視頻分類模型; 其中,所述視頻分類模型包括: 圖像神經網絡,用于對所述至少一個視頻幀分別進行處理,得到所述至少一個視頻幀各自的第一圖像特征; 平均池化層,用于對所述至少一個視頻幀各自的第一圖像特征進行處理,得到所述至少一個視頻幀各自的第二圖像特征; 第一文本神經網絡,用于對所述第一視頻的第一詞向量進行處理,得到所述第一視頻的第一文本特征; 第一全連接層,用于對所述第一視頻的第一文本特征進行處理,得到所述第一視頻的第二文本特征; 第二文本神經網絡,用于對所述第一視頻的第二詞向量進行處理,得到所述第一視頻的第三文本特征; 第二全連接層,用于對所述第一視頻的第三文本特征進行處理,得到所述第一視頻的第四文本特征; 轉換器,用于:對所述至少一個視頻幀各自的第二圖像特征、所述第一視頻的第二文本特征和第四文本特征進行特征拼接,得到N+2*c維的特征,其中,N為視頻幀的數量,c為輸入所述轉換器的特征長度;將所述N+2*c維的特征與c維的類別標識進行特征拼接,得到N+3*c維的特征;將所述N+3*c維的特征與相同維度的位置編碼相加,得到所述轉換器的編碼器的輸入,以使所述轉換器的編碼器輸出所述第一視頻的融合特征;其中,所述轉換器由L層編碼器順序連接而成,每層編碼器由層歸一化LN、多頭注意力機制MSA和多層感知機MLP三種模塊構成,L為正整數; 分類器,用于對所述第一視頻的融合特征進行處理,以實現對所述第一視頻進行分類標注。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人騰訊科技(深圳)有限公司,其通訊地址為:518057 廣東省深圳市南山區高新區科技中一路騰訊大廈35層;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。