電子科技大學葉潤獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉電子科技大學申請的專利一種數據集制作困難下的圖像語義分割方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115187777B 。
龍圖騰網通過國家知識產權局官網在2025-08-22發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210650449.7,技術領域涉及:G06V10/26;該發明授權一種數據集制作困難下的圖像語義分割方法是由葉潤;閆斌;周小佳;李智勇設計研發完成,并于2022-06-09向國家知識產權局提交的專利申請。
本一種數據集制作困難下的圖像語義分割方法在說明書摘要公布了:該發明公開了一種數據集制作困難下的圖像語義分割方法,屬于圖像處理領域。本發明設計的ACGAN相比于現有的數據增廣方法,比如翻轉,旋轉,平移,縮放等,不會破壞目標圖像中的上下文信息,并且能夠生成與真實場景極為相似的數據,用于語義分割網絡訓練時其他數據增廣方法可能會使圖像語義信息發生改變,但是本發明生成出來的樣本由于與真實場景極其相似,不會丟失語義信息。本發明設計的AC?Net相比于其他語義分割給方法,在卷積層設計了兩路卷積,并且融合了多尺度特征信息,能夠提取更豐富的特征信息,從而提升分割效果。
本發明授權一種數據集制作困難下的圖像語義分割方法在權利要求書中公布了:1.一種數據集制作困難下的圖像語義分割方法,該方法包括: 步驟1:樣本的預處理以及數據增廣; 步驟1.1:獲取樣本圖像,并對樣本圖像進行分辨率歸一化,然后將樣本圖像與其對應的語義標簽可視化圖像拼接為新圖像; 步驟1.2:采用ACGAN模型對步驟1得到的新圖像進行數據增廣; 所述ACGAN模型包括:生成器和判別器,所述生成器一共有18層結構,包括編碼部分和解碼部分;所述編碼部分包括:依次連接的第1層到第8層,其中第1層為雙路卷積結構,該結構包括3路,輸入直接分為3路,其中2路結構相同,這兩路依次經過2個3x3卷積層,并且第二個3x3卷積層的輸入和輸出拼接后作為該路的輸出,另外的一路為一個1x1的卷積層,三路的輸出共同融合后為該雙路卷積結構的輸出;第2層為核為2的最大池化結構,第1層與第2層組成了一組卷積池化結構,后續第3、4層,5、6層、7、8層同樣為這種卷積池化結構;所述解碼部分包括:依次連接的第9層到第18層,第9層結構為與第1層結構相同,第10層為上采樣結構,通過雙線性插值實現,第11、12層與第9層、10層結構對應相同,第13層與第1層結構相同;第14層是雙注意力機制結構,該結構通過DANet中的位置注意力機制以及通道注意力機制組成,第15層是上采樣結構,16層是雙路卷積結構,17層是上采樣結構,18層與第1層結構相同;并且,第1層的輸出與第18層的輸出拼接作為第18層的輸出,第3層的輸出與第16層的輸出拼接作為第16層的輸出,第5層的輸出與第13層的輸出拼接作為第13層的輸出,第7層的輸出與第11層的輸出拼接作為第11層的輸出; 數據輸入生成器結構之后,會輸出一個生成圖像,該生成圖像接下來進入判別器中; 所述判別器為全卷積結構,一共有5層結構,其中前三層是3個步長為2的4×4卷積,后面兩層是2個步長為1的4×4卷積,生成器生成圖像進入到判別器后輸出一個標量值,范圍在[0,1]之間,通過輸入訓練數據不斷訓練生成器以及判別器,最終判別器輸出穩定在0.5時訓練結束;此時,向訓練好的生成器輸入樣本,就能生成一個新數據,該新數據為增廣的樣本; 步驟2:建立語義分割網絡;該語義分割網絡與步驟1中的生成器結構相同;但是訓練過程與步驟1不同,步驟1中訓練生成器時,輸入的是語義標簽,而在分語義分割網絡訓練中輸入的是Cityscapes訓練集原始圖像,步驟1中損失函數使用的是條件生成對抗網絡的cGAN-Loss,語義分割網絡損失函數為交叉熵損失函數CrossEntropyLoss; 步驟3:采用步驟1預處理好的數據訓練步驟2得到的語義分割網絡,采用訓練好的語義分割網絡進行實際的圖像語義分割。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人電子科技大學,其通訊地址為:611731 四川省成都市高新區(西區)西源大道2006號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。