科大訊飛股份有限公司胡國平獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉科大訊飛股份有限公司申請的專利訓練數據的評估方法、裝置、電子設備和存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN116628514B 。
龍圖騰網通過國家知識產權局官網在2025-08-08發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202310505745.2,技術領域涉及:G06F18/22;該發明授權訓練數據的評估方法、裝置、電子設備和存儲介質是由胡國平;袁紅亮;胡加學;賀志陽;趙景鶴;鹿曉亮;劉聰;魏思;王士進;劉權設計研發完成,并于2023-05-05向國家知識產權局提交的專利申請。
本訓練數據的評估方法、裝置、電子設備和存儲介質在說明書摘要公布了:本申請提出一種訓練數據的評估方法、裝置、電子設備和存儲介質,能夠計算預先采集的問題數據與訓練數據之間的相似度,若訓練數據中存在至少一條與問題數據之間的相似度大于設定相似度閾值的目標訓練數據,則確定問題數據解答成功,若所有問題數據的問題解答率小于設定的問題解答率閾值,則根據所有解答失敗的問題數據,生成并輸出訓練數據的第一補充數據指示信息,其中,問題解答率表示所有問題數據中、解答成功的問題數據的數量在所有問題數據的占比。以便于能夠根據第一補充數據指示信息對訓練數據進行補充,使訓練數據的完整性符合語音模型的訓練要求,從而可以提升模型訓練效果和訓練效率。
本發明授權訓練數據的評估方法、裝置、電子設備和存儲介質在權利要求書中公布了:1.一種訓練數據的評估方法,其特征在于,包括: 計算預先采集的問題數據與訓練數據之間的相似度,所述訓練數據指的是用于對語言模型進行訓練的文本數據,所述語言模型用于處理自然語言任務,所述自然語言任務包括問答任務和對話任務中的至少一種; 若所述訓練數據中存在至少一條目標訓練數據,與所述問題數據之間的相似度大于設定相似度閾值,則確定所述問題數據解答成功; 若所有問題數據的問題解答率小于設定的問題解答率閾值,則根據所有解答失敗的問題數據,生成并輸出所述訓練數據的第一補充數據指示信息,若所有問題數據的問題解答率大于或者等于所述問題解答率閾值,則確定所述訓練數據為完整數據;所述問題解答率表示所有問題數據中、解答成功的問題數據的數量在所有問題數據的占比。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人科大訊飛股份有限公司,其通訊地址為:230088 安徽省合肥市高新開發區望江西路666號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。