中國空氣動力研究與發展中心計算空氣動力研究所田永強獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉中國空氣動力研究與發展中心計算空氣動力研究所申請的專利一種基于語義與時序的超級計算機作業時長預測方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120372338B 。
龍圖騰網通過國家知識產權局官網在2025-08-22發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510884391.6,技術領域涉及:G06F18/23213;該發明授權一種基于語義與時序的超級計算機作業時長預測方法是由田永強;喻杰;楊文祥;鮮港;賴良;尹航;鄒繼銘;邢國龍;趙丹設計研發完成,并于2025-06-30向國家知識產權局提交的專利申請。
本一種基于語義與時序的超級計算機作業時長預測方法在說明書摘要公布了:本發明提供一種基于語義與時序的超級計算機作業時長預測方法,涉及超級計算機領域,解決了超級計算機作業運行時長預測中忽略作業路徑中語義信息和作業間時序信息的問題。方法首先獲取作業日志數據,通過數據分組區分不同用戶類型,采用不同數據存儲方式存儲用戶的作業日志數據,通過粗粒度聚類方式形成用戶的模型訓練集;隨后通過改進BERT架構的方式構建作業運行時長的預測模型并進行模型訓練,訓練過程中結合時序預測方式,使預測模型基于時序信息預測新作業的時序;訓練完成后,用戶提交新作業的作業路徑信息,預測模型確定新作業的作業類別并輸出作業運行時長。本發明使作業運行時長的預測準確率得到了提高,方便后續的回填調度。
本發明授權一種基于語義與時序的超級計算機作業時長預測方法在權利要求書中公布了:1.一種基于語義與時序的超級計算機作業時長預測方法,其特征在于,包括如下步驟: S1、獲取歷史記錄的作業日志數據并進行數據預處理,預處理后進行作業日志數據的數據分組,通過數據分組區分出不同的用戶類型;作業日志數據中包括作業路徑信息; S2、對應于不同的用戶類型,采用不同的數據存儲方式存儲該用戶的作業日志數據;通過粗粒度聚類方式,篩選該用戶的作業日志數據中不同批次的批處理作業并存儲,作為模型訓練集; S3、通過改進BERT架構的方式構建作業運行時長的預測模型,使用模型訓練集對該預測模型進行訓練; S4、在預測模型訓練過程中結合時序預測方式,提取模型訓練集中已有作業的時序信息,使預測模型基于時序信息對新作業的時序進行預測; S5、預測模型的訓練完成后,用戶提交新作業的作業路徑信息至預測模型,預測模型確定新作業的作業類別并輸出對應的作業運行時長,完成作業時長預測過程; 步驟S3中,構建的預測模型包括輸入層、特征提取層、位置融合層和輸出層; 輸入層接收模型訓練集中的作業路徑信息輸入,生成由詞向量、段向量和位置向量組成的嵌入向量; 嵌入向量由特征提取層處理,通過在改進BERT架構中預設處于不同層數的第一編碼器和第二編碼器,從嵌入向量中分別提取句法特征和深層語義特征的向量編碼信息; 向量編碼信息輸入位置融合層中,進行多維語義融合方式實現特征增強,生成類別概率分布; 輸出層從類別概率分布中選取出置信度最高的類別,作為語義融合的最終分類結果,得到作業路徑信息對應的作業類別;依據得到的作業類別,輸出對應的作業運行時長; 步驟S4中,時序預測方式采用GRU網絡進行時序預測,對于同一用戶中相同批次的批處理作業,預測模型在進行其中新作業的作業運行時長預測時,將新作業前預設數量的已預測作業的作業類別輸入GRU網絡中,提取該批次的批處理作業的運行時序,預測新作業的時序信息,作為新作業的作業類別及作業運行時長的預測參考。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人中國空氣動力研究與發展中心計算空氣動力研究所,其通訊地址為:621052 四川省綿陽市涪城區二環路南段6號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。