四川大學何小海獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉四川大學申請的專利一種基于交叉注意力編碼的從文本生成圖像方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115482302B 。
龍圖騰網通過國家知識產權局官網在2025-08-19發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202110618224.9,技術領域涉及:G06T11/00;該發明授權一種基于交叉注意力編碼的從文本生成圖像方法是由何小海;談馨悅;王正勇;羅曉東;卿粼波;吳小強;滕奇志設計研發完成,并于2021-05-31向國家知識產權局提交的專利申請。
本一種基于交叉注意力編碼的從文本生成圖像方法在說明書摘要公布了:本發明公開了基于一種基于交叉注意力編碼的從文本生成圖像方法。包括以下步驟:文本描述通過交叉注意力編碼器得到交叉注意力特征向量和單詞特征矩陣,交叉注意力編碼器是一個需要預訓練的網絡,該網絡能提取文本信息和原圖像信息,并將這兩種跨模態信息進行翻譯和對齊,最終輸出語言和視覺的聯合編碼后的交叉注意力特征向量。交叉注意力特征向量輸入經典三級對抗生成網絡,逐級生成分辨率為64×64,128×128,256×256的逼真圖像。本發明所述的基于交叉注意力編碼的從文本生成圖像的方法比其他方法效果明顯提升,評價指標綜合表現良好,基本能夠勝任一般的從文本生成圖像任務需要。
本發明授權一種基于交叉注意力編碼的從文本生成圖像方法在權利要求書中公布了:1.一種基于交叉注意力編碼的從文本生成圖像方法,其特征在于包括以下步驟: 步驟一:將文本描述輸入交叉注意力編碼器,該編碼器將對應的文本描述輸入文本特征提取網絡得到一個全局句子向量和一個單詞特征矩陣,將全局句子向量和圖像特征向量分別通過兩個線性層映射到兩個特征空間和,計算交叉注意力分數;再通過歸一化將得到的權重和特征向量相乘,正則化處理后得到交叉編碼;交叉編碼再次經過自注意力網絡進一步檢索上下文信息,最終輸出一個交叉注意力特征向量fc和一個單詞特征矩陣W; 步驟二:交叉注意力特征向量fc和高斯噪聲z結合后輸入初級生成網絡,生成64×64的低分辨率初始圖象,初始圖像特征為F0; 步驟三:將F0和單詞特征矩陣W輸入動態存儲模塊Dynamicmemory中,動態存儲模塊會選擇相應的單詞信息對圖像特征F0進行優化得到F0'; 步驟四:特征F0'輸入第二級生成網絡生成分辨率為128×128的圖像,圖像特征為F1,F1經動態存儲模塊優化后得到特征F1'; 步驟五:特征F1'輸入第三級生成網絡,最終生成分辨率為256×256的高分辨率圖像。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人四川大學,其通訊地址為:610065 四川省成都市武侯區一環路南一段24號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。