騰訊科技(深圳)有限公司李揚名獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網獲悉騰訊科技(深圳)有限公司申請的專利一種序列切分方法、設備及計算機可讀存儲介質獲國家發(fā)明授權專利權,本發(fā)明授權專利權由國家知識產權局授予,授權公告號為:CN113569003B 。
龍圖騰網通過國家知識產權局官網在2025-08-12發(fā)布的發(fā)明授權授權公告中獲悉:該發(fā)明授權的專利申請?zhí)?專利號為:202110209883.7,技術領域涉及:G06F16/334;該發(fā)明授權一種序列切分方法、設備及計算機可讀存儲介質是由李揚名設計研發(fā)完成,并于2021-02-24向國家知識產權局提交的專利申請。
本一種序列切分方法、設備及計算機可讀存儲介質在說明書摘要公布了:本申請?zhí)峁┝艘环N序列切分方法、設備及計算機可讀存儲介質;方法包括:獲取包括n個切分單元的待切分序列,其中,n為大于1的整數(shù);對n個切分單元進行序列切分,獲得與待切分序列對應的候選切分序列得分集合;其中,候選切分序列得分集合為每個候選切分序列對應的候選切分序列得分構成的集合,每個候選切分序列中的各個切片組成待切分序列,候選切分序列得分為各個切片對應的各個切片得分的組合;獲取候選切分序列得分集合中的最高候選切分序列得分;將最高候選切分序列得分對應的候選切分序列,確定為待切分序列的序列切分結果。通過本申請,能夠提升自然語言處理中序列切分的有效性。
本發(fā)明授權一種序列切分方法、設備及計算機可讀存儲介質在權利要求書中公布了:1.一種序列切分方法,其特征在于,包括: 遍歷待切分文本中的每個待切分句子,將遍歷到的所述待切分句子,確定為包括n個切分單元的待切分序列,其中,n為大于1的整數(shù); 遍歷所述n個切分單元,對遍歷到的前i個切分單元再次進行遍歷,針對遍歷到的后j個切分單元,獲取對應的第j個切分前綴和第j個最后切片,其中,i為大于1且小于等于n的整數(shù),j為大于0且小于i-1的整數(shù),所述第j個切分前綴為前i-j個切分單元對應的切分序列,所述第j個最后切片為所述后j個切分單元組成的切片; 基于第1個切分序列得分集合至第i-1個切分序列得分集合,確定所述第j個切分前綴和所述第j個最后切片共同對應的第i個切分序列得分; 繼續(xù)遍歷后j+1個切分單元,直到遍歷完所述前i個切分單元中的后i-1個切分單元時,獲得與所述前i個切分單元對應的i-1個第i個切分序列得分,其中,所述第i個切分序列得分集合包括所述i-1個第i個切分序列得分,所述第i個切分序列得分集合為所述前i個切分單元對應的各個切分序列得分; 基于所述第1個切分序列得分集合至所述第i個切分序列得分集合,繼續(xù)對遍歷到的前i+1個切分單元進行序列切分,直到遍歷完所述n個切分單元時,獲得第n個切分序列得分集合,其中,所述第n個切分序列得分集合為與所述待切分序列對應的候選切分序列得分集合,所述候選切分序列得分集合為每個候選切分序列對應的候選切分序列得分構成的集合,所述每個候選切分序列中的各個切片組成所述待切分序列,所述候選切分序列得分為所述各個切片對應的各個切片得分的組合; 獲取所述候選切分序列得分集合中的最高候選切分序列得分; 將所述最高候選切分序列得分對應的候選切分序列,確定為所述待切分序列的序列切分結果; 當遍歷完所述待切分文本時,獲得所述每個待切分句子對應的所述序列切分結果構成的文本切分序列。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯(lián)系本專利的申請人或專利權人騰訊科技(深圳)有限公司,其通訊地址為:518000 廣東省深圳市南山區(qū)高新區(qū)科技中一路騰訊大廈35層;或者聯(lián)系龍圖騰網官方客服,聯(lián)系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數(shù)據和信息,力求客觀、公正,但并不保證數(shù)據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。