山東大學;西安交通大學章宦樂獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉山東大學;西安交通大學申請的專利一種基于聲音感知的面部表情識別方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120279951B 。
龍圖騰網通過國家知識產權局官網在2025-08-22發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510756910.0,技術領域涉及:G10L25/63;該發明授權一種基于聲音感知的面部表情識別方法及系統是由章宦樂;張雪瑩;付蕾;李劍峰;馬小博;潘潤宇;胡鵬飛;于東曉;成秀珍設計研發完成,并于2025-06-09向國家知識產權局提交的專利申請。
本一種基于聲音感知的面部表情識別方法及系統在說明書摘要公布了:本發明屬于面部表情識別技術領域,具體涉及一種基于聲音感知的面部表情識別方法及系統。所述方法采用聲學信號作為感知媒介,利用麥克風陣列捕捉聲音反射信號,并通過信號處理生成包含面部特征的聲譜圖,從所述聲譜圖中提取特征,并利用深度學習網絡對面部表情進行分類,實現表情識別。本發明提供的面部表情識別方法能夠無需依賴昂貴的硬件設備,利用商用揚聲器和麥克風陣列,即便在數據量較少的情況下,也能有效實現面部表情識別。
本發明授權一種基于聲音感知的面部表情識別方法及系統在權利要求書中公布了:1.一種基于聲音感知的面部表情識別方法,其特征在于,所述方法采用聲學信號作為感知媒介,利用麥克風陣列捕捉聲音反射信號,并通過信號處理生成包含面部特征的聲譜圖,從所述聲譜圖中提取特征,并利用深度學習網絡對面部表情進行分類,實現表情識別; 所述方法包括以下步驟: 1信號發送:通過揚聲器發射間隔的FMCW波形的聲音信號,所述聲音信號抵達人臉后被反射,生成聲音反射信號,麥克風陣列接收所述聲音反射信號; 2信號處理:所述信號處理過程包括音頻幀分割子步驟、距離測量子步驟、聲譜圖生成子步驟和坐標系轉換子步驟; 所述音頻幀分割子步驟用于從麥克風陣列的錄音中提取面部反射的聲音信號; 所述距離測量子步驟用于計算人臉到麥克風陣列之間的距離; 所述聲譜圖生成子步驟通過SRP-PHAT算法生成包含面部信息的聲譜圖; 所述坐標系轉子步驟用于將所述聲譜圖從球坐標系轉換為笛卡爾坐標系; 3表情分類:通過預訓練的深度學習模型從聲譜圖中提取特征,將提取的特征輸入到深度神經網絡中,深度神經網絡通過學習特征與表情類別之間的映射關系,輸出用戶的面部表情分類結果; 步驟2中,所述音頻幀分割子步驟包括: 從麥克風陣列的原始錄音中定位直接傳播信號; 在直接傳播信號后定位主反射信號,從而確定面部反射信號的位置; 從麥克風陣列的錄音中確定面部反射信號位置后,再從麥克風陣列的錄音中分割提取面部反射的聲音信號; 步驟2中,所述距離測量子步驟具體包括: 使用FMCW雷達測距算法,將接收信號與發射信號進行混頻,生成中頻信號; 在測量距離時,假設在兩個FMCW脈沖之間的空白時間段內存在連續的FMCW信號,通過滑動窗口逐步向后搜索,直至在中頻信號中檢測到某一頻率出現顯著幅值; 人臉與麥克風陣列之間的距離d通過以下公式計算: d=N*dmax+dwin 其中,N表示滑動窗口的數量,dmax表示單個脈沖的最大測距距離,dwin表示當前窗口測得的距離; 步驟2中,所述聲譜圖生成子步驟采用SRP-PHAT算法生成聲譜圖; 在采用SRP-PHAT算法生成聲譜圖的過程中,方位角的計算的范圍為[-180°,180°],俯仰角的計算范圍為: 其中,d為人臉與麥克風陣列之間的距離;ddiag為繪制圖像的對角線長度;φmin是SRP-PHAT對空間進行掃描范圍的俯仰角的最小值; 俯仰角的最小分辨率res為:
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人山東大學;西安交通大學,其通訊地址為:266200 山東省青島市即墨區濱海路72號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。