中國人民解放軍國防科技大學陳洪輝獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉中國人民解放軍國防科技大學申請的專利用于小樣本意圖識別的完型填空式的數據增強方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115455144B 。
龍圖騰網通過國家知識產權局官網在2025-08-08發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202211071426.7,技術領域涉及:G06F16/334;該發明授權用于小樣本意圖識別的完型填空式的數據增強方法是由陳洪輝;張鑫;蔡飛;江苗;鄭建明;宋城宇;邵太華;郭昱普;王夢如設計研發完成,并于2022-09-02向國家知識產權局提交的專利申請。
本用于小樣本意圖識別的完型填空式的數據增強方法在說明書摘要公布了:本申請中一個或多個實施例提供了一種用于小樣本意圖識別的完型填空式的數據增強方法,內容包括:基于預訓練語言模型構建完型填空式的數據增強任務用于意圖識別,先采用無監督學習方法使得數據增強的結果在語義上與原始輸入句子相似,然后再基于度量分類采用有監督的對比學習方法,使得同一類別的意圖樣本在嵌入空間中更接近彼此,不同類別的意圖樣本更遠離彼此,對比學習方法包括原型層面的對比學習和實例層面的對比學習。在不破壞句法結構和增加噪音的情況下產生有意義的數據,充分利用了有限的數據并獲得可分離的嵌入。在嵌入空間中獲得更好的距離分布,從而改善基于度量的分類方法的性能。
本發明授權用于小樣本意圖識別的完型填空式的數據增強方法在權利要求書中公布了:1.一種用于小樣本意圖識別的完形填空式的數據增強方法,其特征是,包括:基于預訓練語言模型構建完形填空式的數據增強任務用于意圖識別,先采用無監督學習方法使得數據增強的結果在語義上與原始輸入句子相似,然后再基于度量分類采用有監督的對比學習方法,使得同一類別的意圖樣本在嵌入空間中更接近彼此,不同類別的意圖樣本更遠離彼此,對比學習方法包括原型層面的對比學習和實例層面的對比學習; 所述無監督學習方法包括:以預訓練語言模型作為特征提取器,采用標記來掩蓋設定比例的輸入詞,根據輸入句子的上下文的語義來預測這些被掩蓋的標記;特征提取器通過加入兩個特殊標記后,將完形填空式的意圖識別任務中的句子編碼為隱藏層向量表示,兩個特殊標記分別表示完形填空式的意圖識別任務中句子的開始和結束,該過程通過以下公式表示: 其中,F·為特征提取器,T為完形填空式模板,[MASK]為被掩蓋的單詞的標記,PatT,x為數據增強模式,x是輸入句子,表示隱藏層向量,[CLS]和[SEP]分別表示開始和結束; 將隱藏層向量視為被掩蓋的單詞[MASK]的表示,將看作是根據模式PatT,x生成的句子表示,其在語義上與輸入句子x是相似的,所有輸入樣本上重復公式1得到相應的數據增強結果; 在不引入任何外部知識和標簽的情況下,將輸入句子x送入預訓練語言模型中,獲得其低維向量表示,將其表述為: 其中,隱藏層向量表示為整個句子x,通過以下損失函數: 用于縮小和之間的距離。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人中國人民解放軍國防科技大學,其通訊地址為:410003 湖南省長沙市開福區德雅路109號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。