廈門快商通科技股份有限公司洪國強獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉廈門快商通科技股份有限公司申請的專利一種交互式的語音分割與聚類方法、裝置以及設備獲國家發(fā)明授權專利權,本發(fā)明授權專利權由國家知識產(chǎn)權局授予,授權公告號為:CN114708850B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權局官網(wǎng)在2025-08-12發(fā)布的發(fā)明授權授權公告中獲悉:該發(fā)明授權的專利申請?zhí)?專利號為:202210174989.2,技術領域涉及:G10L15/00;該發(fā)明授權一種交互式的語音分割與聚類方法、裝置以及設備是由洪國強;肖龍源;李稀敏;葉志堅設計研發(fā)完成,并于2022-02-24向國家知識產(chǎn)權局提交的專利申請。
本一種交互式的語音分割與聚類方法、裝置以及設備在說明書摘要公布了:本發(fā)明公開了一種交互式的語音分割與聚類方法、裝置、設備及存儲介質(zhì),其包括:對待處理音頻數(shù)據(jù)進行預處理,得到N類語音;對所述N類語音進行審聽,并將屬于同一人的語音進行合并,得到M類語音,其中,所述M類語音與音頻對話中的人數(shù)相對應;基于所述M類語音計算每類語音的中心向量以及每類語音中所包含的各語音片段的相似度,并將所述相似度低于預設值的語音片段進行標注;對標注的所述語音片段進行審聽,并對標注的所述語音片段進行重新分配,得到音頻分類結果。能夠提高語音分割聚類結果的準確性。
本發(fā)明授權一種交互式的語音分割與聚類方法、裝置以及設備在權利要求書中公布了:1.一種交互式的語音分割與聚類方法,其特征在于,所述方法包括: 對待處理音頻數(shù)據(jù)進行預處理,得到N類語音; 所述對待處理音頻數(shù)據(jù)進行預處理,得到N類語音,包括: 利用VAD算法對所述待處理音頻數(shù)據(jù)進行去噪,得到第一音頻; 對所述第一音頻進行切片處理,得到多個音頻片段; 基于預設的相似度閾值將所述音頻片段進行聚類,得到所述N類語音; 所述基于預設的相似度閾值將所述音頻片段進行聚類,得到所述N類語音,包括: 利用聲紋提取算法提取每個所述音頻片段的聲紋特征向量; 根據(jù)所述聲紋特征向量計算所述音頻片段之間的相似度,并根據(jù)所述相似度閾值進行聚類,得到所述N類語音; 對所述N類語音進行審聽,并將屬于同一人的語音進行合并,得到M類語音,其中,所述M類語音與音頻對話中的人數(shù)相對應; 基于所述M類語音計算每類語音的中心向量以及每類語音中所包含的各語音片段的相似度,并將所述相似度低于預設值的語音片段進行標注; 所述中心向量為通過計算所述M類語音中每一所述語音片段的向量的均值; 對標注的所述語音片段進行審聽,并對標注的所述語音片段進行重新分配,得到音頻分類結果。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術,可聯(lián)系本專利的申請人或?qū)@麢嗳?a target="_blank" rel="noopener noreferrer nofollow" href="https://iptop.www.gztjhr.cn/list?keyword=%E5%8E%A6%E9%97%A8%E5%BF%AB%E5%95%86%E9%80%9A%E7%A7%91%E6%8A%80%E8%82%A1%E4%BB%BD%E6%9C%89%E9%99%90%E5%85%AC%E5%8F%B8&temp=1">廈門快商通科技股份有限公司,其通訊地址為:361009 福建省廈門市集美區(qū)軟件園三期誠毅北大街63號1301單元;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。