杭州電子科技大學周仁杰獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉杭州電子科技大學申請的專利一種基于多任務雙邊分支網絡的引文意圖分類方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114328923B 。
龍圖騰網通過國家知識產權局官網在2025-08-15發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202111638197.8,技術領域涉及:G06F16/35;該發明授權一種基于多任務雙邊分支網絡的引文意圖分類方法是由周仁杰;胡天祥設計研發完成,并于2021-12-29向國家知識產權局提交的專利申請。
本一種基于多任務雙邊分支網絡的引文意圖分類方法在說明書摘要公布了:本發明公開一種基于多任務雙邊分支網絡的引文意圖分類方法,為了緩解數據集不平衡問題對模型性能造成影響,采用雙邊分支網絡作為基礎網絡結構。在訓練過程中先獲得原始數據集,還利用過采樣技術生成反轉數據集以及構建輔助數據集。為了能夠引入輔助數據集的信息采用了多任務學習方法。在構建模型時采用SciBert模型作為嵌入層來提取輸入的引文文本的特征向量,此外還利用注意力機制來構建注意力層,用于提高模型對引文文本中重要單詞的注意力,降低對其他單詞的關注度。最后模型通過一個自適應參數α在訓練過程中轉移模型的注意力。本發明提高了引文意圖分類的準確性,從而可以更準確地預測引文的意圖類別。
本發明授權一種基于多任務雙邊分支網絡的引文意圖分類方法在權利要求書中公布了:1.一種基于多任務雙邊分支網絡的引文意圖分類方法,其特征在于包括以下步驟: 步驟1:獲取帶有意圖分類標簽的引文文本數據,作為原數據集Do;同時將整個原始數據集劃分成原始數據集的訓練集、驗證集、測試集; 步驟2:利用過采樣方法對Do的訓練集進行采樣生成反轉數據集Dr;具體如下: 2-1根據公式1計算原數據集的訓練集中每個類別的比率 其中表示第cm個類別的樣本數;Nmax表示樣本數最多的類別對應樣本數; 2-2利用每個類別的比率計算每個類別采樣概率 其中nc表示意圖的類別數; 2-3迭代采樣: 2-3-1初始化利用庫函數隨機得到一個值num,num的取值范圍為[0,1;同時初始化變量sum為0; 2-3-2對原數據集的訓練集中每個類別依次遍歷 1對于遍歷到的類別,利用當前類別的采樣概率更新sum的值,即 2判斷是否滿足隨機數num≤sum,若是則從當前類別中隨機挑選一個引文文本數據加入到反轉數據集中,若否則不操作; 3對下一個類別進行遍歷,重復步驟1-2,直至完成所有類別遍歷; 2-3-3判斷反轉數據集中元素個數與原數據集的訓練集是否相同,若是則結束,若否則返回至步驟2-3-1; 步驟3:獲取分類標簽是科學文獻的章節名的引文文本數據,構建輔助數據集Da; 步驟4:搭建基于多任務雙邊分支網絡模型,利用原數據集的訓練集、反轉數據集、輔助數據集進行訓練; 所述基于多任務雙邊分支網絡模型包括輸入層、嵌入層、注意力層、輔助任務模塊、主任務模塊、輸出層; 所述輸入層用于接收原數據集的訓練集、反轉數據集、輔助數據集中的文本數據,再對文本數據進行預處理操作; 所述嵌入層采用SciBert模型,用于將文本數據轉化成向量矩陣Ha、Ho、Hr; 所述注意力層包括第一文本注意力模塊、第二文本注意力模塊; 所述輔助任務模塊包括線性層、Softmax函數層; 所述主任務模塊包括連接層、線性層、Softmax函數層; 所述輸出層接收輔助任務模塊和主任務模塊的輸出; 步驟5:利用訓練好的基于多任務雙邊分支網絡模型,進行驗證、測試; 步驟6:利用測試后的基于多任務雙邊分支網絡模型實現對引文文本的引文意圖分類。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人杭州電子科技大學,其通訊地址為:310018 浙江省杭州市下沙高教園區2號大街;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。