華東交通大學楊剛獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉華東交通大學申請的專利一種唇語識別方法、裝置、設備、介質及產品獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120182771B 。
龍圖騰網通過國家知識產權局官網在2025-08-15發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510646116.0,技術領域涉及:G06V10/80;該發明授權一種唇語識別方法、裝置、設備、介質及產品是由楊剛;王貝爾;曹漢武;吳敏;戴麗珍;鐘晟軒設計研發完成,并于2025-05-20向國家知識產權局提交的專利申請。
本一種唇語識別方法、裝置、設備、介質及產品在說明書摘要公布了:本申請公開了一種唇語識別方法、裝置、設備、介質及產品,涉及機器視覺和自然語言處理交叉領域,該方法包括獲取待識別的原始視頻,初始化文本序列,對原始視頻進行切割,得到多個幀圖像,提取每個幀圖像的幀內特征及幀間特征。根據全部幀圖像的幀間特征,得到視頻特征。根據視頻特征以及文本序列,采用唇語識別模型,得到唇語識別結果。唇語識別模型為預先根據訓練樣本集搭建的神經網絡多模態融合模型。本申請通過獲取每個幀圖像的幀內特征和幀間特征,得到視頻特征,并進一步通過將文本序列以及視頻特征進行多模態特征融合,提高了模型的特征表現能力和區分度,并進一步提高了唇語識別的準確性。
本發明授權一種唇語識別方法、裝置、設備、介質及產品在權利要求書中公布了:1.一種唇語識別方法,其特征在于,所述唇語識別方法包括: 獲取待識別的原始視頻,初始化文本序列; 對所述原始視頻進行切割,得到多個幀圖像;每個幀圖像包含講話者的唇部區域; 提取每個幀圖像的幀內特征,并根據全部幀圖像的幀內特征,提取每個幀圖像的幀間特征; 根據全部幀圖像的幀間特征,得到視頻特征; 根據所述視頻特征以及所述文本序列,采用唇語識別模型,得到唇語識別結果;所述唇語識別模型為預先根據訓練樣本集搭建的神經網絡多模態融合模型;所述訓練樣本集中的每個訓練樣本包括樣本視頻特征、樣本文本序列以及目標唇語識別結果; 所述文本序列包括開始字符和終止字符,所述終止字符位于所述文本序列的最后一個標簽位置,所述?神經網絡多模態融合模型包括深度學習算法和多模態特征融合方法; 根據所述視頻特征以及所述文本序列,采用唇語識別模型,得到唇語識別結果,具體包括: 針對第i次迭代,根據所述文本序列的前i個標簽,采用深度學習算法,得到前i個標簽對應的文本特征;i0;所述文本序列的第1個標簽為所述開始字符; 根據前i個標簽對應的文本特征以及所述視頻特征,采用多模態特征融合方法,得到第i個預測詞元,并將所述第i個預測詞元作為所述文本序列的第i+1個標簽;若所述第i個預測詞元為所述終止字符,則所述文本序列的第2至第i個標簽為唇語識別結果,否則,進行第i+1次迭代。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人華東交通大學,其通訊地址為:330013 江西省南昌市經濟技術開發區雙港東大街808號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。