福建帝視科技集團有限公司周遠波獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉福建帝視科技集團有限公司申請的專利一種單圖幾何紋理聯合控制的圖像生成方法與終端獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120259479B 。
龍圖騰網通過國家知識產權局官網在2025-08-15發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510740949.3,技術領域涉及:G06T11/00;該發明授權一種單圖幾何紋理聯合控制的圖像生成方法與終端是由周遠波;鄧煒;高欽泉;童同設計研發完成,并于2025-06-05向國家知識產權局提交的專利申請。
本一種單圖幾何紋理聯合控制的圖像生成方法與終端在說明書摘要公布了:本發明的一種單圖幾何紋理聯合控制的圖像生成方法與終端,接收用戶傳入的原始圖像和文本提示信息,并基于所述原始圖像生成人臉子圖、關鍵點圖和正面化人臉圖像;對所述人臉子圖進行特征的提取和處理,生成人臉身份隱向量;基于所述關鍵點圖和所述正面化人臉圖像,生成隱空間控制向量;基于所述文本提示信息生成文本嵌入特征;將所述人臉身份隱向量、所述文本嵌入特征以及拼接噪聲向量后的所述隱空間控制向量,采用分層選擇性特征注入的方式注入擴散變換器模型,并結合解碼器生成身份保持圖像;所述擴散變換器模型采用低秩適配訓練策略訓練得到;實現單圖驅動,多姿態風格的身份保持圖像的可控生成。
本發明授權一種單圖幾何紋理聯合控制的圖像生成方法與終端在權利要求書中公布了:1.一種單圖幾何紋理聯合控制的圖像生成方法,其特征在于,包括步驟: S1、接收用戶傳入的原始圖像和文本提示信息,并基于所述原始圖像生成人臉子圖、關鍵點圖和正面化人臉圖像; 步驟S1包括步驟: S11、接收用戶傳入的原始圖像和文本提示信息; S12、將所述原始圖像通過人臉識別算法獲得人臉區域邊界框,裁剪出人臉子圖; S13、對所述人臉子圖進行人臉關鍵點檢測,根據檢測結果生成關鍵點圖; S14、對所述人臉子圖進行背景移除,并執行姿態校正處理,利用空間變換算法對齊人臉朝向并優化姿態參數,生成正面化人臉圖像; 步驟S14包括步驟: S141、將人臉子圖通過BiSeNet分割模型進行人臉分割,并移除背景; S142、采用LivePortrait中的隱式關鍵點方法計算人臉子圖與標準正面化人臉的俯仰角信息; S143、將俯仰角信息和所述人臉子圖輸入LivePortrait中的Stitching模塊中,獲得目標位置的中間態人臉; S144、將中間態人臉輸入LivePortrait中Warpping模塊和解碼器中,生成正面化人臉圖像; S2、對所述人臉子圖進行特征的提取和處理,生成人臉身份隱向量;基于所述關鍵點圖和所述正面化人臉圖像,生成隱空間控制向量;基于所述文本提示信息生成文本嵌入特征; 所述人臉身份隱向量的生成包括步驟: 將所述人臉子圖輸入人臉特征提取器中,通過ElasticFace算法進行人臉特征的提取; 將提取到的人臉特征通過MLP層和LayerNorm層處理,生成所述人臉身份隱向量; 所述隱空間控制向量的生成包括步驟: 將所述關鍵點圖和所述正面化人臉圖像通過VAE編碼模型進行編碼,將編碼后的向量進行拼接,得到所述隱空間控制向量; S3、將所述人臉身份隱向量、所述文本嵌入特征以及拼接噪聲向量后的所述隱空間控制向量,采用分層選擇性特征注入的方式注入擴散變換器模型,并結合解碼器生成身份保持圖像; 所述擴散變換器模型采用低秩適配訓練策略訓練得到。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人福建帝視科技集團有限公司,其通訊地址為:350002 福建省福州市鼓樓區洪山鎮洪山園路華潤萬象城三期TB#寫字樓16層01單元;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。