騰訊云計算(長沙)有限責任公司許茜獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉騰訊云計算(長沙)有限責任公司申請的專利詞標準化方法、裝置、設備及存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114328813B 。
龍圖騰網通過國家知識產權局官網在2025-08-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202111328754.6,技術領域涉及:G06F40/151;該發明授權詞標準化方法、裝置、設備及存儲介質是由許茜;張子恒設計研發完成,并于2021-11-10向國家知識產權局提交的專利申請。
本詞標準化方法、裝置、設備及存儲介質在說明書摘要公布了:本申請實施例提供一種了詞標準化方法、裝置、設備及存儲介質,涉及領域云技術領域中的云醫療技術領域,本申請基于空間對候選標準詞進行分組的思路,將概念體系中的候選標準詞的表示向量進行分組,并在分組后的候選標準詞中進行匹配,能夠在召回階段能夠縮小搜索的范圍,有利于排除掉距離較遠的分組中的候選標準詞,能夠提升召回階段的效率和速度。另外,考慮到不同候選標準詞可能對應不同的維度,本申請將該候選空間中候選標準詞的表示向量的維度和該非標準詞的表示向量的維度設計為相同的維度,能夠提升召回準確度。
本發明授權詞標準化方法、裝置、設備及存儲介質在權利要求書中公布了:1.一種詞標準化方法,其特征在于,包括: 接收詞標準化請求,所述詞標準化請求用于請求將非標準詞進行標準化; 響應于所述詞標準化請求,基于所述非標準詞的表示向量和M個候選空間分別對應的M個中心位置的表示向量,從M個候選空間中選擇N個候選空間;其中,所述候選空間中候選標準詞的表示向量的維度和所述非標準詞的表示向量的維度相同,M>N≥1; 基于所述非標準詞的表示向量,從所述N個候選空間中選擇K個候選標準詞,所述N個候選空間中的每一個候選標準詞具有對應的用于表征所述非標準詞和候選標準詞之間的匹配程度的分數; 將所述非標準詞的表示向量與所述K個候選標準詞的表示向量分別進行拼接,得到K個拼接文本,K≥1; 以所述K個拼接文本為輸入,利用來自轉換的雙向編碼器BERT模型,得到對所述非標準詞對應的標準詞; 其中,所述以所述K個拼接文本為輸入,利用來自轉換的雙向編碼器BERT模型,得到對所述非標準詞對應的標準詞,包括: 以所述K個拼接文本為輸入,利用所述BERT模型得到所述K個候選標準詞分別對應的K個概率; 基于所述K個概率對所述K個候選標準詞進行排序,得到所述非標準詞對應的候選標準詞排序,并將所述候選標準詞排序中排在首位的候選標準詞,確定為所述非標準詞對應的標準詞。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人騰訊云計算(長沙)有限責任公司,其通訊地址為:410000 湖南省長沙市岳麓區天頂街道環湖路1177號方茂苑(二期)12、13、15棟2012室;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。