中國電子科技集團公司第十研究所陳偉晴獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉中國電子科技集團公司第十研究所申請的專利一種基于文本沖突檢測的文本鑒偽方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115759109B 。
龍圖騰網通過國家知識產權局官網在2025-08-15發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202211324359.5,技術領域涉及:G06F18/22;該發明授權一種基于文本沖突檢測的文本鑒偽方法是由陳偉晴;代翔;崔瑩;高翔;何健軍;丁洪麗;廖泓舟;潘磊;戴禮燦設計研發完成,并于2022-10-27向國家知識產權局提交的專利申請。
本一種基于文本沖突檢測的文本鑒偽方法在說明書摘要公布了:本發明公開了一種基于文本沖突檢測的文本鑒偽方法,其包括:分別從兩個描述相同事件的文本中提取事件句,并形成對應的兩個事件句列表,分別為第一事件句列表和第二事件句列表;將第一事件句列表中的事件句與第二事件句列表中的事件句進行事件句沖突檢測、事件要素沖突檢測和句子語義相似度檢測;若事件句沖突檢測、事件要素沖突檢測和句子語義相似度檢測三者的檢測結果均為沖突時,則兩個描述相同事件的文本之間存在沖突。本發明結合多種方法協同檢測,保障檢測結果的高準確性,采用深度學習模型,實現自動檢測,且能夠對沖突檢測點進行直觀展示,檢測結果具備充足的可解釋性和值得信賴,自動檢測,大大減少了人工工作,提升了檢測效率。
本發明授權一種基于文本沖突檢測的文本鑒偽方法在權利要求書中公布了:1.一種基于文本沖突檢測的文本鑒偽方法,其特征在于,包括: 步驟1:分別從兩個描述相同事件的文本中提取事件句,并形成對應的兩個事件句列表,分別為第一事件句列表和第二事件句列表; 步驟2:將所述第一事件句列表中的事件句與所述第二事件句列表中的事件句進行事件句沖突檢測、事件要素沖突檢測和句子語義相似度檢測; 步驟3:若事件句沖突檢測、事件要素沖突檢測和句子語義相似度檢測三者的檢測結果均為沖突時,則兩個描述相同事件的文本之間存在沖突; 所述步驟1包括: 步驟11:分別對兩個描述相同事件的文本進行分句; 步驟12:將每個句子送入事件句檢測模型中進行檢測,輸出是否為事件句;其中,所述事件句包括事件施事者、事件觸發詞、事件受事者、發生時間和發生地點; 步驟13:將同一個文本對應的事件句形成列表,最終得到所述第一事件句列表的事件句和所述第二事件句列表; 在所述步驟2中, 將所述第一事件句列表中的事件句與所述第二事件句列表中的事件句進行事件句沖突檢測,包括: 步驟21:分別從所述第一事件句列表和所述第二事件句列表中選取一個未被選取過的事件句; 步驟22:將選取的兩個事件句同時輸入上下句關系預測的多分類模型,得到關系標簽;其中,所述關系標簽包括順承、沖突和獨立; 步驟23:重復執行步驟21至步驟22,直至所述第一事件句列表和所述第二事件句列表中均不存在未被選取過的事件句為止; 在所述步驟2中, 所述將所述第一事件句列表中的事件句與所述第二事件句列表中的事件句進行事件要素沖突檢測,包括: 步驟211:分別從所述第一事件句列表和所述第二事件句列表中選取一個未被選取過的事件句; 步驟212:將步驟211中選取的兩個事件句輸入事件要素抽取模型,得到每個事件句對應的事件要素;其中,所述事件要素包括施事者、受事者、觸發詞、時間、地點; 步驟213:判斷兩個事件句對應的事件要素之間的相似度,得到兩個事件句之間是否存在沖突; 步驟214:重復執行步驟211至步驟213,直至所述第一事件句列表和所述第二事件句列表中均不存在未被選取過的事件句為止; 所述步驟213包括: 采用詞相似度計算算法計算兩個事件要素的相似度; 若兩個事件句存在五分之四相同的事件要素和五分之一不同的事件要素,則兩個事件句之間存在沖突; 在所述步驟2中, 所述將所述第一事件句列表中的事件句與所述第二事件句列表中的事件句進行句子語義相似度檢測,包括: 步驟2111:分別從所述第一事件句列表和所述第二事件句列表中選取一個未被選取過的事件句; 步驟2112:分別對兩個事件句進行分詞,計算分詞后的詞語之間的相似度; 步驟2113:基于詞語之間的相似度以及對應事件句之間的相似度,得到兩個事件句之間是否存在沖突; 步驟2114:重復執行步驟2111至步驟2113,直至所述第一事件句列表和所述第二事件句列表中均不存在未被選取過的事件句為止; 所述步驟2113包括: 步驟21131:若詞語之間的相似度高于預設門限,則兩個詞語之間存在相似性; 步驟21132:計算兩個詞語對應的兩個事件句之間的語義相似度; 步驟21133:若計算得到的語義相似度低于設置的門限值,則兩個事件句存在沖突;否則,不存在沖突; 所述步驟21132包括: 分別將兩個詞語對應的兩個事件句經過BERT預訓練模型進行特征向量編碼,得到兩個一維向量,通過余弦相似度計算法計算兩個一維向量之間的語義相似度。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人中國電子科技集團公司第十研究所,其通訊地址為:610000 四川省成都市金牛區茶店子東街48號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。