西南石油大學羅仁澤獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉西南石油大學申請的專利一種基于滑動掩膜的視頻行為數據增強方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN116029929B 。
龍圖騰網通過國家知識產權局官網在2025-08-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202310021230.5,技術領域涉及:G06T5/00;該發明授權一種基于滑動掩膜的視頻行為數據增強方法是由羅仁澤;譚亮;羅任權;鄧治林;余泓;李華督設計研發完成,并于2023-01-07向國家知識產權局提交的專利申請。
本一種基于滑動掩膜的視頻行為數據增強方法在說明書摘要公布了:本發明提出一種基于滑動掩膜的視頻行為數據增強方法。該方法先對原有視頻行為訓練樣本進行增強,構建新的增強樣本,具體實施方法為:首先從全部數據集中隨機提取出連續的視頻圖片并進行預處理作為訓練樣本;然后獲取到模型訓練的訓練輪次信息,并計算數據增強算法的觸發概率;然后根據觸發概率判斷是否對訓練樣本進行數據增強;判斷為不需要增強時,直接使用訓練樣本對視頻行為識別模型進行訓練;判斷為需要增強時,獲取訓練樣本的長度、寬度、幀數信息,并據此產生對應的隨機掩膜;最后將隨機掩膜與訓練樣本進行合并得到增強樣本,最后使用增強樣本對視頻行為識別模型進行訓練。與現有技術相比,本發明具有提升效果好、效率優、簡單等優點。
本發明授權一種基于滑動掩膜的視頻行為數據增強方法在權利要求書中公布了:1.一種基于滑動掩膜的視頻行為數據增強方法,其特征包括以下步驟: 步驟1、制作訓練樣本X,具體步驟如下: 1從數據集中隨機選取出n個幀數為f的視頻樣本X′,f∈1,64];X′為c×f個a×b矩陣,a∈224,1080;b∈224,1080;c為視頻圖像的通道數量,c∈{1,3}; 2對n個幀數為f的視頻樣本X′進行尺寸變換得到變換尺寸視頻樣本X″,X″為c×f個w×h;w、h為固定值224;然后對X″進行最大最小值歸一化處理得到歸一化視頻樣本X″′,X″′為c×f個w×h矩陣;計算公式如下: 式中x″'wh代表矩陣X″′中的單個元素,x″'wh∈-1,1;x″'wh代表矩陣X″′中的單個元素,x″wh∈0,255;xmin代表歸一化的最小值,xmin=-1;xmax代表歸一化的最大值,xmax=1; 3最后將n個歸一化視頻樣本X″′組成一個集合X作為訓練樣本,X={X1″',X2″′,X3″′,…,X″'n};訓練樣本X為n×c×f個w×h矩陣;n為訓練樣本X中歸一化視頻樣本X″′的數量,n∈N; 步驟2、數據增強算法根據訓練輪次ei和最大訓練輪次em計算觸發概率pi,并得到訓練樣本X中的每一幀圖像xi和相對應的掩膜Mi,具體步驟如下: 1根據模型的訓練輪次ei,和最大訓練輪次em,計算數據增強算法的觸發概率pi,觸發概率的計算公式為: 式中pi為數據增強算法的第i輪觸發概率,pi∈0,1];em代表最大訓練輪次,em∈N;ei代表當前第i輪訓練輪次,ei∈1,em]; 2設置第i輪訓練輪次的隨機概率qi,qi=random0,1;當第i輪訓練輪次的隨機概率qi大于觸發概率pi時,算法使用三個參數l、j、r來產生掩膜M1,M1為c個相同的w×h矩陣組成,mik代表掩膜M1中c個相同的w×h矩陣的第i行k列的元素;mik∈{0,1},i∈0,224,k∈0,224;掩膜M1中mik的計算公式如下: M1是與訓練樣本X中第1幀圖像x1相對應的掩膜,M1為c個w×h矩陣;mwh∈{0,1},mwh代表掩膜M1中的單個元素;l代表掩膜M1中柵格的數量,l∈[4,14];j代表掩膜M1中柵格的寬度,j∈[16,56];r代表掩膜M1隨機旋轉的角度,r∈1°,360°];三個參數的計算公式為: l=randlmin,lmax j=randomjmin,jmax r=random1°,360° 式中jmax代表M1中柵格的寬度j隨機取值的上界,jmax∈[16,56];jmin代表M1中柵格的寬度j隨機取值的下界,jmin≤jmax;jmin,jmax的計算公式為: 式中h代表掩膜M1的高度,l代表掩膜M1中柵格的數量; 3數據增強算法對訓練樣本X中的每一幀圖像xi和相對應的掩膜Mi進行合成,Mi為c個w×h矩陣;掩膜Mi的計算公式為: 0<i<f,w1+dw<wd<w2+dw,h1+dh<hd<h2+dh式中,i為訓練樣本X中第i幀圖像,w、h代表掩膜Mi的長寬,pi為數據增強算法的第i輪觸發概率,f為訓練樣本X的幀數,wd代表掩膜Mi中刪除區域的橫坐標范圍,wd∈0,w;hd代表掩膜Mi中刪除區域的縱坐標范圍,hd∈0,h;w1,h1代表掩膜M1中刪除區域的左上角坐標,w2,h2代表掩膜M1中刪除區域的右下坐標,{w1,h1,w2,h2}∈0,224;dw、dh代表掩膜Mi的移動距離,dw、dh計算公式如下: 式中,i為訓練樣本X中第i幀圖像,f為訓練樣本X的幀數; 步驟3、使用步驟2中產生的掩膜Mi對與訓練樣本X進行合成,得到增強樣本具體步驟如下: 1當第i輪訓練輪次的隨機概率qi大于觸發概率pi時,qi=random0,1;算法對n個歸一化視頻樣本X″′進行數據增強得到增強視頻樣本為c×f個w×h矩陣;的計算公式如下: 式中,f為歸一化視頻樣本X″′的幀數,Zi″′;i={1,2,…,f},代表歸一化視頻樣本X″′中第i幀圖像,Zi″′為c個w×h矩陣;Mi;i={1,2,…,f},代表與歸一化視頻樣本X″′中第i幀圖像Zi″′相乘的掩膜,Mi為c個w×h矩陣; 2對將n個增強視頻樣本組合得到增強樣本增強算法的計算公式為: 式中,qi為第i輪訓練輪次的隨機概率,qi=random0,1;pi為增強算法在第i輪訓練輪次的觸發概率;X為訓練樣本,訓練樣本X為n×c×f個w×h矩陣;代表增強視頻樣本,增強視頻樣本為c×f個w×h矩陣,代表增強樣本,為n個增強視頻樣本組成的集合,為n×c×f個w×h矩陣。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人西南石油大學,其通訊地址為:610500 四川省成都市新都區新都大道8號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。