杭州電子科技大學張威獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉杭州電子科技大學申請的專利基于自適應采樣與多尺度時序兩階段的全參考視頻質量評價方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115239647B 。
龍圖騰網通過國家知識產權局官網在2025-08-22發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210786730.3,技術領域涉及:G06T7/00;該發明授權基于自適應采樣與多尺度時序兩階段的全參考視頻質量評價方法是由張威;殷海兵;王鴻奎;黃曉峰設計研發完成,并于2022-07-06向國家知識產權局提交的專利申請。
本基于自適應采樣與多尺度時序兩階段的全參考視頻質量評價方法在說明書摘要公布了:本發明屬于圖像及視頻處理領域,公開了一種基于自適應采樣與多尺度時序兩階段的全參考視頻質量評價方法,包括如下步驟:步驟1:獲取訓練樣本集Xtrain和測試樣本集Xtest:步驟2:對訓練集的每個視頻Vd與Vr進行自適應采樣:步驟3:構建多尺度時空域特征提取網絡MTN:步驟4:構建基于多通道自注意力機制的質量決策模塊:步驟5:對全參考視頻質量評價模型MTN進行迭代訓練:步驟6:獲取全參考視頻的質量評價結果。本發明方案能夠測量原始視頻和失真視頻之間的感知差異,可用于視頻壓縮、傳輸和處理中的質量檢測評估。
本發明授權基于自適應采樣與多尺度時序兩階段的全參考視頻質量評價方法在權利要求書中公布了:1.一種基于自適應采樣與多尺度時序兩階段的全參考視頻質量評價方法,其特征在于,包括如下步驟: 步驟1:獲取訓練樣本集Xtrain和測試樣本集Xtest: 步驟2:對訓練集的每個視頻Vd與Vr進行自適應采樣: 步驟2a:確定分段數目與每段序列的長度: 對于每個訓練視頻Vd與Vr與通常為300幀到600幀之間,按照T=18幀的長度,將測試視頻分為n個序列片段:其中與表示第i個測試失真片段與參考片段,i=1,2,...,n,n≥2且n為整數; 步驟2b:確定每段子序列的起始點: 對于每個測試片段其中表示在第i段測試序列中,PMD指標最大的幀,表示為以此幀為起點往后去T幀的序列段,也同理; 步驟2c:計算空域失真度: 對于空域失真是以每一幀的圖像形式呈現,靜態圖像質量評價方法包括多尺度結構相似性MS-SSIM、特征相似性FSIM和梯度相似度偏差GMSD,采用梯度相似度偏差進行靜態質量估計,以字符FQSt表示; 步驟2c1:梯度幅度的計算需要使用兩個正交方向3x3大小的Prewitt算子分別與參考圖片r和失真圖片d進行卷積,得到r和d的水平梯度與垂直梯度,兩個正交方向梯度的均方根代表了圖片梯度幅度,水平與垂直方向的3x3大小Prewitt算子hx,hy被定義為: mri和mdi表示的位置i處的梯度幅度大小,表示卷積操作: 步驟2c2:根據步驟2c1的計算結果,計算各個區域i的梯度幅度相似度衡量其失真程度GMS: 步驟2c3:共K個區域的GMS平均池化,得到梯度幅度相似度平均值GMSM衡量整幅圖片質量: 步驟2c4:對每個區域進行標準差池化得到t時刻圖片質量GMSDt: 步驟2d:為充分刻畫時域掩蔽帶來的影響,同時對運動強度與運動方向進行描述: 步驟2d1:視頻幀被劃分為Nblo塊不重疊48×48大小的宏塊,并用宏塊級運動矢量幅度的均值表示當前幀的運動強度: 其中是mi,jt指是第t時刻幀i,j位置宏塊的運動矢量幅度; 步驟2d2:通過計算視頻幀的光流直方圖HOFt,k,得到第t時刻分布在k角度范圍的光流幅度,幀內運動矢量的主導運動方向θ由幅度最大的光流決定,統計所有方向光流得到第t幀的主導運動方向: 將2π劃分為8個角度范圍; 步驟2d3:定義時域掩蔽程度FMTt為幀級運動強度與主導運動方向乘積: 表示歸一化操作,運動程度FMTt被線性歸一化在0-1之間,其值越接近1表示運動越明顯; 步驟2d4:計算每幀的PMD: 為確保分母非零,取γ值為1的常數; 步驟3:構建多尺度時空域特征提取網絡MTN: 構建串行連接空域特征提取模塊SFE和多尺度時域提取模塊MTFE的多尺度時空域特征提取網絡MTN,其中,空域特征提取模塊SFE采用去除最后一個全連接層的VGG-16網絡結構;時域多尺度模塊MTFE包括并行堆疊的3個LSTM網絡層、2個由多重平均池化層組成的下采樣模塊和2個鄰接插值層組成的上采樣模塊; 步驟3a:構建空域特征提取模塊SFE: 空域特征提取模塊SFE包括5個卷積模塊和2個全連接層,其具體結構為:卷積模塊1→卷積模塊2→卷積模塊3→卷積模塊4→卷積模塊5→全連接層1→全連接層2; 卷積模塊1和卷積模塊2均由2個卷積層和1個最大池化層組成,具體結構為:卷積層1→卷積層2→最大池化層1;卷積層的卷積核大小均為3×3,步長均為1,卷積模塊1的2個卷積層的卷積核數量均為64,卷積模塊2的2個卷積層的卷積核數量均為128; 卷積模塊3、4、5均由3個卷積層和1個最大池化層組成,所述卷積模塊具體結構為:卷積層1→卷積層2→卷積層3→第一最大池化層;卷積層的卷積核大小均為3×3,步長均為1,卷積模塊3的3個卷積層的卷積核數量均設置為256,卷積模塊4、5的3個卷積層的卷積核數量均設置為512; 步驟3b:構建多尺度時域特征提取模塊MTFE: 時域多尺度模塊MTFE包括并行堆疊的3個LSTM網絡層、2個由平均池化層組成的下采樣模塊和2個鄰接插值層組成的上采樣模塊,采樣的時間步長{α1,α2,α3}取{0,2,4},故LSTM網絡層的長度也依次遞減,為保證每兩個LSTM層之間的特征維度相同,由細粒度特征出發聚合到粗粒度特征時,增加一個下采樣模塊降低數據通道數;而由粗粒度特征出發與細粒度特征聚合時,則上采樣模塊對數據升緯; 步驟4:構建基于多通道自注意力機制的質量決策模塊: 步驟5:對全參考視頻質量評價模型MTN進行迭代訓練: 步驟6:獲取全參考視頻的質量評價結果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人杭州電子科技大學,其通訊地址為:310018 浙江省杭州市下沙高教園區2號大街;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。