浪潮電子信息產業股份有限公司馬嘉威獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉浪潮電子信息產業股份有限公司申請的專利訓練樣本數據生成方法、設備、可讀存儲介質及程序產品獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120277419B 。
龍圖騰網通過國家知識產權局官網在2025-08-22發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510765113.9,技術領域涉及:G06F18/214;該發明授權訓練樣本數據生成方法、設備、可讀存儲介質及程序產品是由馬嘉威;李令君;吳韶華設計研發完成,并于2025-06-10向國家知識產權局提交的專利申請。
本訓練樣本數據生成方法、設備、可讀存儲介質及程序產品在說明書摘要公布了:本發明公開了一種訓練樣本數據生成方法、設備、可讀存儲介質及程序產品,涉及人工智能技術領域。其中,方法包括將編程語言處理任務的種子題目和提示詞輸入至樣本數據生成模型;利用提示詞基于同一算法思維對種子題目在修改范圍邊界條件內進行修改,根據新題目類型和用例生成條件生成覆蓋新題目約束條件的測試用例集。對通過驗證的新題目進行解答,并輸出通過測試用例集驗證的答案;將新題目、測試用例集和答案作為訓練樣本數據;調整修改范圍邊界條件和或提示詞和或用例生成條件,利用新題目生成新的訓練樣本數據。本發明可以解決相關技術生成的訓練數據無法滿足模型訓練需求的問題,能夠高效為編程語言處理任務生成高質量的訓練樣本數據。
本發明授權訓練樣本數據生成方法、設備、可讀存儲介質及程序產品在權利要求書中公布了:1.一種訓練樣本數據生成方法,其特征在于,包括: 將編程語言處理任務的種子題目和提示詞,輸入至基于語言模型構建的樣本數據生成模型; 利用所述提示詞通過所述樣本數據生成模型,基于同一算法思維對所述種子題目在修改范圍邊界條件內進行修改,根據新題目類型和用例生成條件生成覆蓋新題目約束條件的測試用例集;驗證新題目和所述測試用例集,將通過驗證的測試用例集輸出,對通過驗證的新題目進行解答,并輸出通過所述測試用例集驗證的答案;將所述新題目、所述測試用例集和所述答案作為第一組訓練樣本數據; 將所述新題目輸入至所述樣本數據生成模型,調整所述修改范圍邊界條件和或所述提示詞和或所述用例生成條件,生成第二組訓練樣本數據; 其中,所述第一組訓練樣本數據、所述第二組訓練樣本數據為文本數據、圖像數據、音視頻數據的其中一種或任意組合; 其中,基于同一算法思維對所述種子題目在修改范圍邊界條件內進行修改,包括: 通過對所述種子題目的考點進行分析,確定所述種子題目的算法類型和或數據結構類型;根據算法類型和或數據結構類型,確定所述種子題目的多種修改方式;從所述種子題目與各修改方式的隨機組合中,選擇符合與所述種子題目具有相同考點且至少增加一個新技術點的條件的修改方式,作為最優組合修改方式;基于所述最優組合修改方式對所述種子題目進行相應修改,得到新題目。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人浪潮電子信息產業股份有限公司,其通訊地址為:250014 山東省濟南市高新區草山嶺南路801號9層東側;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。