福建帝視科技集團有限公司張藝忠獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉福建帝視科技集團有限公司申請的專利一種身份保持圖像的生成方法與終端獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120260103B 。
龍圖騰網通過國家知識產權局官網在2025-08-15發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510741913.7,技術領域涉及:G06V40/16;該發明授權一種身份保持圖像的生成方法與終端是由張藝忠;周遠波;鄧煒;高欽泉;童同設計研發完成,并于2025-06-05向國家知識產權局提交的專利申請。
本一種身份保持圖像的生成方法與終端在說明書摘要公布了:本發明涉及一種身份保持圖像的生成方法與終端,接收用戶傳入的目標人物圖像以及文本提示信息;對目標人物圖像進行面部特征和身體全局特征的分層提取,并進行特征融合生成融合特征;根據文本提示信息生成文本嵌入特征;將文本嵌入特征、面部特征和融合特征輸入預訓練的擴散模型,生成身份保持圖像;其中,融合特征僅注入擴散模型中對身份保留作用最大的身份敏感層,面部特征僅注入身份敏感層外的其它層;本發明通過分層提取面部與身體特征,并采用選擇性注入策略,將核心身份特征限定于關鍵層,在保證面部和身體同步保持的基礎上,避免過度干擾文本驅動的細節生成,解決文本控制能力受限問題;并實現身份保真、身體協調與文本語義的高效平衡。
本發明授權一種身份保持圖像的生成方法與終端在權利要求書中公布了:1.一種身份保持圖像的生成方法,其特征在于,包括步驟: S1、接收用戶傳入的目標人物圖像以及文本提示信息; S2、對所述目標人物圖像進行面部特征和身體全局特征的分層提取,并進行特征融合生成融合特征;根據所述文本提示信息生成文本嵌入特征; 所述面部特征和身體全局特征的提取包括步驟: 通過圖像分割算法對所述目標人物圖像進行分割,生成人物全景圖; 采用人臉檢測識別模型裁剪出所述人物全景圖中的人臉區域圖像,生成面部圖; 將所述人物全景圖和所述面部圖輸入分層身份提取網絡,由其中的身體全局特征編碼器和面部特征編碼器分別對所述人物全景圖和所述面部圖進行特征編碼,生成面部特征和身體全局特征; 所述身體全局特征編碼器的組成包括預設個數并行的特征流分支,預設個數的所述特征流分支用于捕捉從局部紋理至全局姿態的多粒度特征,每個所述特征流分支包括層數不同的深度可分離卷積層; 所述身體全局特征編碼器對所述人物全景圖進行特征編碼包括步驟: 將所述人物全景圖分別輸入預設個數的所述特征流分支,進行分層特征提取,得到預設個數的分支特征; 引入聚合門機制整合各所述特征流分支的輸出,并通過殘差結構進行特征增強,生成身體全局特征; 所述融合特征的生成包括步驟: 使用可學習的線性投影層將所述身體全局特征轉換投影至與所述面部特征兼容的維度空間; 通過特征交互網絡對所述面部特征和投影的所述身體全局特征進行融合; 通過兩層MLP進行特征交互并引入殘差連接機制,生成融合特征; S3、將所述文本嵌入特征、所述面部特征和所述融合特征輸入預訓練的擴散模型,生成身份保持圖像; 其中,所述融合特征僅注入擴散模型中對身份保留作用最大的身份敏感層,所述面部特征僅注入所述身份敏感層外的其它層。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人福建帝視科技集團有限公司,其通訊地址為:350002 福建省福州市鼓樓區洪山鎮洪山園路華潤萬象城三期TB#寫字樓16層01單元;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。