北京郵電大學陳勇獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉北京郵電大學申請的專利一種面向虛擬數(shù)字人交互的基于文本片段的主題挖掘方法獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN115048496B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-08-08發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202210479506.X,技術(shù)領(lǐng)域涉及:G06F16/3329;該發(fā)明授權(quán)一種面向虛擬數(shù)字人交互的基于文本片段的主題挖掘方法是由陳勇;喬秀全;劉瑞;嚴輝;黃亞坤設(shè)計研發(fā)完成,并于2022-05-05向國家知識產(chǎn)權(quán)局提交的專利申請。
本一種面向虛擬數(shù)字人交互的基于文本片段的主題挖掘方法在說明書摘要公布了:本發(fā)明公開了一種面向虛擬數(shù)字人交互的基于文本片段的主題挖掘方法,包括:對文本數(shù)據(jù)進行處理,得到詞串序列;基于詞串序列構(gòu)建文本片段序列;統(tǒng)計文本片段序列中的文本片段的詞共現(xiàn)模式,構(gòu)建詞?詞共現(xiàn)矩陣;對詞?詞共現(xiàn)矩陣進行歸一化處理,得到詞?詞相關(guān)度矩陣S;將詞?詞相關(guān)度矩陣S分解成詞語?主題矩陣和它的轉(zhuǎn)置之間的乘積。本申請的主題挖掘方法將重點從文檔轉(zhuǎn)換到局部上下文環(huán)境的文本片段能夠帶來更多語義相關(guān)的主題信息,同時也減少了錯誤的語義信息;另外,利用文本片段而不是文檔能夠用一種統(tǒng)一的方式來處理各式各樣的文本,無論是長文本數(shù)據(jù)集、短文本數(shù)據(jù)集,還是單個的文檔比如說一部小說。
本發(fā)明授權(quán)一種面向虛擬數(shù)字人交互的基于文本片段的主題挖掘方法在權(quán)利要求書中公布了:1.一種基于文本片段的主題挖掘方法,其特征在于,包括: 對文本數(shù)據(jù)進行處理,得到詞串序列; 基于所述詞串序列構(gòu)建文本片段序列; 統(tǒng)計所述文本片段序列中的文本片段的詞共現(xiàn)模式,構(gòu)建詞-詞共現(xiàn)矩陣; 對所述詞-詞共現(xiàn)矩陣進行歸一化處理,得到詞-詞相關(guān)度矩陣S,詞-詞相關(guān)度矩陣S表示兩兩詞語之間的詞義相關(guān)度; 將詞-詞相關(guān)度矩陣S分解成詞語-主題矩陣和它的轉(zhuǎn)置之間的乘積,其中M代表著詞語的數(shù)目,K代表著主題的數(shù)目,詞語-主題矩陣U的每一行為每一個詞語在主題空間上的表示,詞語-主題矩陣U的每一列為一個主題,并且滿足: 其中,OU表示信息損失量,F(xiàn)表示矩陣的F-范數(shù); 其中, 其中,V是中間輔助變量,為U的一個拷貝,α是非負的超參數(shù),用來控制矩陣V和矩陣U的接近程度,α的值越大,則這兩個矩陣越接近相等。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人北京郵電大學,其通訊地址為:100876 北京市海淀區(qū)西土城路10號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。