北京科技大學張?zhí)煜璜@國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網獲悉北京科技大學申請的專利一種自由文本引導的遙感圖像指代分割方法和系統(tǒng)獲國家發(fā)明授權專利權,本發(fā)明授權專利權由國家知識產權局授予,授權公告號為:CN120340034B 。
龍圖騰網通過國家知識產權局官網在2025-08-26發(fā)布的發(fā)明授權授權公告中獲悉:該發(fā)明授權的專利申請?zhí)?專利號為:202510823159.1,技術領域涉及:G06V20/70;該發(fā)明授權一種自由文本引導的遙感圖像指代分割方法和系統(tǒng)是由張?zhí)煜?溫兆堃;李江昀;王宏;袁立;莊培顯設計研發(fā)完成,并于2025-06-19向國家知識產權局提交的專利申請。
本一種自由文本引導的遙感圖像指代分割方法和系統(tǒng)在說明書摘要公布了:本發(fā)明提供一種自由文本引導的遙感圖像指代分割方法和系統(tǒng),包括:構建包括圖像、文本和各種標簽的數據樣本,輸入并訓練區(qū)域關系驅動圖文分割模型,模型包括的動態(tài)關聯(lián)視覺編碼器,對圖像進行多尺度感知與動態(tài)響應增強,生成多尺度視覺特征;像素級解碼器,對進行像素級解碼輸出圖像掩碼信息;上下文關聯(lián)文本編碼器,對文本進行語義建模生成屬性?對象信息;區(qū)域關系建模模塊,對和分別進行區(qū)域?視覺和區(qū)域?語言建模交互,得到區(qū)域過濾器和區(qū)域關聯(lián)特征;目標導向聯(lián)合解碼器,對、和進行聯(lián)合解碼,實現(xiàn)模型的多頭預測輸出。本發(fā)明可以對遙感圖像進行分割。
本發(fā)明授權一種自由文本引導的遙感圖像指代分割方法和系統(tǒng)在權利要求書中公布了:1.一種自由文本引導的遙感圖像指代分割方法,其特征在于,所述方法包括: S1、收集并預處理遙感圖像數據; S2、對預處理后的圖像數據進行實例級目標掩碼標注和其他處理得到各種標簽,構造多樣化的自然語言描述本文,構建得到包括圖像、文本和各種標簽的數據樣本; S3、將所述數據樣本輸入并訓練區(qū)域關系驅動圖文分割模型,所述區(qū)域關系驅動圖文分割模型包括動態(tài)關聯(lián)視覺編碼器、像素級解碼器、上下文關聯(lián)文本編碼器、區(qū)域關系建模模塊和目標導向聯(lián)合解碼器模塊; 所述動態(tài)關聯(lián)視覺編碼器,對輸入的圖像數據進行多尺度感知與動態(tài)響應增強,生成具備空間結構信息的多尺度視覺特征; 所述像素級解碼器,對所述多尺度視覺特征進行像素級解碼,輸出包括圖像各類別實例的圖像掩碼信息; 所述上下文關聯(lián)文本編碼器,對輸入的文本進行語義建模,綜合提取其中包括的各種關鍵信息,生成具備上下文結構感知能力的屬性-對象信息; 所述區(qū)域關系建模模塊,對所述和分別進行區(qū)域-視覺建模交互和區(qū)域-語言建模交互,逐步整合各類語義信息,提升模型對復雜表達的理解與建模能力,得到區(qū)域過濾器和區(qū)域關聯(lián)特征; 所述目標導向聯(lián)合解碼器,對所述、和進行聯(lián)合解碼,判斷輸入文本是否與圖像存在真實語義匹配,并進行多目標合并和無目標診斷,實現(xiàn)模型的多頭預測輸出:目標掩碼、區(qū)域概率以及目標存在判別; S4、使用訓練完成的區(qū)域關系驅動圖文分割模型,對待分割遙感圖像進行分割。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯(lián)系本專利的申請人或專利權人北京科技大學,其通訊地址為:100083 北京市海淀區(qū)學院路30號;或者聯(lián)系龍圖騰網官方客服,聯(lián)系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。