華為技術有限公司尹伊淳獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉華為技術有限公司申請的專利一種神經網絡訓練方法以及裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN113505883B 。
龍圖騰網通過國家知識產權局官網在2025-09-05發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202110603464.1,技術領域涉及:G06N3/084;該發明授權一種神經網絡訓練方法以及裝置是由尹伊淳;尚利峰;蔣欣;陳曉設計研發完成,并于2021-05-31向國家知識產權局提交的專利申請。
本一種神經網絡訓練方法以及裝置在說明書摘要公布了:本申請公開了人工智能領域的一種神經網絡訓練方法以及裝置,用于通過在資源約束條件的約束下進行同質搜索,減少搜索空間的大小,高效地搜索得到符合需求的模型。該方法包括:獲取超預訓練語言模型;獲取資源約束條件以及超參數搜索空間,資源約束條件指示針對模型占用的資源的約束,超參數搜索空間指示模型的超參數的范圍;在資源約束條件的約束下從超參數搜索空間中搜索出目標模型的結構,目標模型的至少兩層網絡層的超參數相同;對目標模型進行訓練,得到訓練后的目標模型。
本發明授權一種神經網絡訓練方法以及裝置在權利要求書中公布了:1.一種神經網絡訓練方法,其特征在于,包括: 獲取超預訓練語言模型; 獲取資源約束條件以及超參數搜索空間,所述資源約束條件指示針對模型占用的資源的約束,所述超參數搜索空間指示模型的超參數的范圍; 在資源約束條件的約束下從所述超參數搜索空間中搜索出目標模型的結構,所述目標模型的至少兩層網絡層的超參數相同; 對所述目標模型進行訓練,得到訓練后的目標模型; 所述在資源約束條件的約束下從所述超參數搜索空間中搜索出目標模型的結構,包括: 在資源約束條件的約束下,從所述超參數搜索空間中搜索得到至少一個模型結構,所述至少一個模型結構中每個模型結構對應的模型的至少兩層網絡層的超參數相同; 從所述超預訓練語言模型中采集與所述至少一個模型結構對應的至少一個第二子模型; 根據所述至少一個第二子模型從所述至少一個模型結構中篩選出輸出結果符合預設條件的模型結構,得到所述目標模型的結構。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人華為技術有限公司,其通訊地址為:518129 廣東省深圳市龍崗區坂田華為總部辦公樓;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。