武漢大學陳震中獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉武漢大學申請的專利一種可變碼率圖像壓縮方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115439567B 。
龍圖騰網通過國家知識產權局官網在2025-08-08發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202211055600.9,技術領域涉及:G06T9/00;該發明授權一種可變碼率圖像壓縮方法及系統是由陳震中;王懷睿設計研發完成,并于2022-08-31向國家知識產權局提交的專利申請。
本一種可變碼率圖像壓縮方法及系統在說明書摘要公布了:本發明針對端到端優化的圖像壓縮領域,公開了一種可變碼率圖像壓縮方法及系統。首先通過獨熱編碼將碼率控制參數λ轉換為二進制向量,再通過全連接層根據編碼結果自適應地生成多組專家投票權重。與此同時,模型將對應生成與專家權重數量相同的多組卷積核參數,并通過根據專家權重加權求和的方式實現最終動態卷積核的高效生成。最終以上述生成的動態參數卷積核構建變分自編碼器。本方法提出的可變碼率模型可以有效地根據碼率調節參數改變壓縮過程中的數據分布變化方向,并且動態參數調節的設計可以有效降低整體變碼率壓縮框架的運算量,實現在端到端優化的壓縮框架中以單個壓縮模型控制多種壓縮碼率。
本發明授權一種可變碼率圖像壓縮方法及系統在權利要求書中公布了:1.一種可變碼率圖像壓縮方法,其特征在于, 輸入圖像或特征至構建的訓練好的包含有變分自編碼器的壓縮模型中;其中,所述變分自編碼器的構建過程包括:通過獨熱編碼將碼率控制參數λ轉換為二進制向量,再通過全連接層根據編碼結果自適應地生成多組專家投票權重;生成與專家權重數量相同的多組卷積核參數,并通過根據專家權重加權求和的生成動態卷積核;將生成的動態卷積核替代普通卷積核構建變分自編碼器;采用梯度下降方法對變分自編碼器進行訓練,使用可變碼率訓練策略優化變分自編碼器; 其中,在訓練時,將梯度下降方法應用于損失函數中,并使用可變碼率訓練策略進行整體模型的優化,具體時間通過主編碼器從輸入圖像x中獲取到潛在表達y,再通過超先驗編碼器從潛在表達y中獲取到超潛在表達z;隨機選取拉格朗日乘子λ進行動態參數卷積核的生成以及損失函數的構建,使得壓縮模型對碼率調節參數始終敏感,進而構建可變碼率推理的端到端優化圖像壓縮模型; 壓縮模型對輸入的圖像或特征進行壓縮優化后輸出壓縮后的圖像或特征;其中,所述壓縮模型的構建過程包括:對碼率控制參數進行編碼,定義編碼碼率控制參數的取值區間Λ,取Λ={256,512,1024,2048,4096,6048},碼率控制參數λ∈Λ;使用全連接網絡預測專家權重,采用神經網絡中的全連接層與線性整流激活函數結合作為權重生成工具,通過拉格朗日乘子λ作為碼率控制參數生成了一組自適應調節的專家權重用于下一步的數據變分方向引導;生成多組可學習卷積核參數,采用卷積神經網絡對輸入特征進行級聯式的連續變分,對多組卷積核進行同步的參數更新,將生成的自適應調節的專家權重進行動態分配卷積核;根據模擬專家權重對卷積核進行加權求和,動態參數化卷積的卷積次數是多卷積操作線性組合的使用動態卷積重構壓縮模型;將動態參數卷積替換掉圖像壓縮框架中的所有普通卷積,卷積操作均為以碼率調節參數為條件的動態卷積,在進行訓練引導下即可進行相應的條件變分編解碼;構建可變碼率的率失真損失函數。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人武漢大學,其通訊地址為:430072 湖北省武漢市武昌區珞珈山街道八一路299號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。