中國(guó)華能集團(tuán)清潔能源技術(shù)研究院有限公司鄭子辰獲國(guó)家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉中國(guó)華能集團(tuán)清潔能源技術(shù)研究院有限公司申請(qǐng)的專利文本分類模型的訓(xùn)練方法及裝置、文本分類方法及裝置獲國(guó)家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國(guó)家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN116069926B 。
龍圖騰網(wǎng)通過(guò)國(guó)家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-08-12發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202211447376.8,技術(shù)領(lǐng)域涉及:G06F16/355;該發(fā)明授權(quán)文本分類模型的訓(xùn)練方法及裝置、文本分類方法及裝置是由鄭子辰;邸智;李小翔;葛戈;劉雅欣設(shè)計(jì)研發(fā)完成,并于2022-11-18向國(guó)家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。
本文本分類模型的訓(xùn)練方法及裝置、文本分類方法及裝置在說(shuō)明書(shū)摘要公布了:本公開(kāi)提出一種文本分類模型的訓(xùn)練方法及裝置、文本分類方法及裝置,其中,方法包括:獲取訓(xùn)練文本,并采用文本分類模型中的編碼網(wǎng)絡(luò)對(duì)訓(xùn)練文本進(jìn)行編碼,以得到第一語(yǔ)義特征;獲取噪聲特征;將噪聲特征和第一語(yǔ)義特征進(jìn)行融合,以得到融合特征;基于第一語(yǔ)義特征和融合特征,對(duì)文本分類模型進(jìn)行第一訓(xùn)練。由此,基于文本分類模型的編碼網(wǎng)絡(luò)捕捉到的訓(xùn)練文本的語(yǔ)義特征,以及融合了噪聲的語(yǔ)義特征,可以實(shí)現(xiàn)對(duì)文本分類模型的預(yù)訓(xùn)練,可以使得文本分類模型在真實(shí)訓(xùn)練之前,有效學(xué)習(xí)到訓(xùn)練文本中顯著的語(yǔ)義信息,從而在利用少量的訓(xùn)練文本對(duì)文本分類模型進(jìn)行真實(shí)訓(xùn)練時(shí),可以提升模型的表現(xiàn)和性能,有效減少模型對(duì)標(biāo)注數(shù)據(jù)的依賴。
本發(fā)明授權(quán)文本分類模型的訓(xùn)練方法及裝置、文本分類方法及裝置在權(quán)利要求書(shū)中公布了:1.一種文本分類模型的訓(xùn)練方法,其特征在于,所述方法包括: 獲取訓(xùn)練文本,并采用文本分類模型中的編碼網(wǎng)絡(luò)對(duì)所述訓(xùn)練文本進(jìn)行編碼,以得到第一語(yǔ)義特征; 獲取噪聲特征;其中,所述噪聲特征和所述第一語(yǔ)義特征的尺寸匹配; 將所述噪聲特征和所述第一語(yǔ)義特征進(jìn)行融合,以得到融合特征; 基于所述第一語(yǔ)義特征和所述融合特征,對(duì)所述文本分類模型進(jìn)行第一訓(xùn)練; 其中,所述采用文本分類模型中的編碼網(wǎng)絡(luò)對(duì)所述訓(xùn)練文本進(jìn)行編碼,以得到第一語(yǔ)義特征,包括: 對(duì)所述訓(xùn)練文本進(jìn)行分詞處理,以得到所述訓(xùn)練文本的至少一個(gè)分詞; 獲取所述至少一個(gè)分詞對(duì)應(yīng)的詞向量; 基于所述至少一個(gè)分詞在所述訓(xùn)練文本中的位置,對(duì)所述至少一個(gè)分詞對(duì)應(yīng)的詞向量進(jìn)行組合,以得到輸入向量; 將所述輸入向量輸入至所述文本分類模型中的編碼網(wǎng)絡(luò),以采用所述編碼網(wǎng)絡(luò)對(duì)所述輸入向量進(jìn)行編碼,得到所述第一語(yǔ)義特征; 其中,所述基于所述第一語(yǔ)義特征和所述融合特征,對(duì)所述文本分類模型進(jìn)行第一訓(xùn)練,包括: 將所述融合特征輸入所述文本分類模型中對(duì)抗網(wǎng)絡(luò)中的生成器,以得到所述生成器輸出的第二語(yǔ)義特征; 將所述第一語(yǔ)義特征和所述輸入向量進(jìn)行拼接,以得到第一拼接特征; 將所述第一拼接特征輸入鑒別器,以得到所述鑒別器輸出的第一輸出值; 將所述第一語(yǔ)義特征和所述第二語(yǔ)義特征進(jìn)行拼接,以得到第二拼接特征; 將所述第二拼接特征輸入所述鑒別器,以得到所述鑒別器輸出的第二輸出值; 根據(jù)所述第一輸出值和所述第二輸出值,確定第一損失值; 根據(jù)所述第一損失值,對(duì)所述文本分類模型進(jìn)行第一訓(xùn)練。
如需購(gòu)買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人中國(guó)華能集團(tuán)清潔能源技術(shù)研究院有限公司,其通訊地址為:102209 北京市昌平區(qū)北七家未來(lái)科技城華能人才創(chuàng)新創(chuàng)業(yè)基地實(shí)驗(yàn)樓A樓;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開(kāi)、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 華為技術(shù)有限公司何伯勇獲國(guó)家專利權(quán)
- 青島科技大學(xué)王衛(wèi)獲國(guó)家專利權(quán)
- 濰坊瑞通環(huán)保科技有限公司王通獲國(guó)家專利權(quán)
- 阿里巴巴集團(tuán)控股有限公司申瀟瀟獲國(guó)家專利權(quán)
- 日鐵新材料股份有限公司山田隆獲國(guó)家專利權(quán)
- 廈門英仕衛(wèi)浴有限公司陸海濤獲國(guó)家專利權(quán)
- 廣東新龍海洋裝備科技有限公司曹健獲國(guó)家專利權(quán)
- 深圳市中科藍(lán)訊科技股份有限公司陳文韜獲國(guó)家專利權(quán)
- 阿里巴巴集團(tuán)控股有限公司賈晨曦獲國(guó)家專利權(quán)
- 阿里巴巴集團(tuán)控股有限公司鄭衛(wèi)東獲國(guó)家專利權(quán)


熱門推薦
- 東京毅力科創(chuàng)株式會(huì)社中澤貴士獲國(guó)家專利權(quán)
- 德州儀器公司高見(jiàn)澤彰一獲國(guó)家專利權(quán)
- 深圳怡化電腦股份有限公司崔明杰獲國(guó)家專利權(quán)
- 三星顯示有限公司金圣民獲國(guó)家專利權(quán)
- 頂級(jí)公司戴維·漢韋爾獲國(guó)家專利權(quán)
- 上海拓牛智能科技有限公司沈泉獲國(guó)家專利權(quán)
- 維美德自動(dòng)化有限公司H·霍塔里獲國(guó)家專利權(quán)
- 南京南瑞繼保電氣有限公司王凱獲國(guó)家專利權(quán)
- 株式會(huì)社麥迪帕克特金圣鎮(zhèn)獲國(guó)家專利權(quán)
- 華為技術(shù)有限公司王明哲獲國(guó)家專利權(quán)