北京捷通華聲科技股份有限公司胡洪兵獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉北京捷通華聲科技股份有限公司申請的專利提取實體全稱對應簡稱的方法和裝置,電子設備獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN112560492B 。
龍圖騰網通過國家知識產權局官網在2025-08-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202011466836.2,技術領域涉及:G06F40/295;該發明授權提取實體全稱對應簡稱的方法和裝置,電子設備是由胡洪兵;李健;陳明;武衛東設計研發完成,并于2020-12-14向國家知識產權局提交的專利申請。
本提取實體全稱對應簡稱的方法和裝置,電子設備在說明書摘要公布了:本發明提供了一種提取實體全稱對應簡稱的方法和裝置以及電子設備,其中,所述方法包括:按照第一預設規則,將各歷史文本轉換為第一句子向量;按照所述第一預設規則,將目標實體全稱轉換為第二句子向量;依據所述第二句子向量與各所述第一句子向量的相似度,從各所述第一句子向量中提取滿足預設條件的第一數量的目標句子向量;分別從各所述目標句子向量對應的目標歷史文本中,提取所述目標實體全稱對應的簡稱。本發明提供的提取實體全稱對應簡稱的方法,系統自動從歷史文本中提取實體全稱對應的簡稱,無需人工手動提取,能夠節省大量的人力資源且提取效率高。
本發明授權提取實體全稱對應簡稱的方法和裝置,電子設備在權利要求書中公布了:1.一種提取實體全稱對應簡稱的方法,其特征在于,所述方法包括: 按照第一預設規則,將各歷史文本轉換為第一句子向量; 針對任一所述歷史文本,按照第一預設規則,將所述歷史文本轉換為第一句子向量的步驟,包括: 對所述歷史文本進行預處理,確定所述歷史文本中包含的各分詞;其中,所述預處理包括:分詞、詞性標注以及停用詞過濾處理; 針對各所述分詞和所述分詞在各所述歷史文本中的出現頻率,確定所述分詞對應的文檔頻率和詞頻; 依據所述文檔頻率和詞頻,確定所述分詞對應的TF-IDF值; 基于所述歷史文本中包含的各分詞、以及各所述分詞對應的TF-IDF值,生成所述歷史文本轉換后的第一句子向量; 按照所述第一預設規則,將目標實體全稱轉換為第二句子向量; 依據所述第二句子向量與各所述第一句子向量的相似度,從各所述第一句子向量中提取滿足預設條件的第一數量的目標句子向量; 分別從各所述目標句子向量對應的目標歷史文本中,提取所述目標實體全稱對應的簡稱; 提取所述目標實體全稱對應的簡稱的步驟包括:針對每個所述目標歷史文本,將所述目標歷史文本和所述目標實體全稱輸入神經網絡序列預測模型中,其中,所述神經網絡序列預測模型用于預測所述目標實體全稱在所述目標歷史文本中的位置; 依據所述神經網絡序列預測模型輸出的所述位置,從所述目標歷史文本中提取所述目標實體全稱對應的簡稱。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京捷通華聲科技股份有限公司,其通訊地址為:100193 北京市海淀區東北旺西路8號中關村軟件園2號樓A座一層2101;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。