蘇州鴻鵠騏驥電子科技有限公司魯逢源獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉蘇州鴻鵠騏驥電子科技有限公司申請的專利一種基于深度學習的全景音頻編碼方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN116453527B 。
龍圖騰網通過國家知識產權局官網在2025-08-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202310424297.3,技術領域涉及:G10L19/00;該發明授權一種基于深度學習的全景音頻編碼方法是由魯逢源;溫凱林;褚潔;李天紅;張呈愷;孔亮;王鹍;蔡覺平設計研發完成,并于2023-04-20向國家知識產權局提交的專利申請。
本一種基于深度學習的全景音頻編碼方法在說明書摘要公布了:本發明涉及全景音頻編碼技術領域。一種基于深度學習的全景音頻編碼方法,將每個聲源產生L幀的音頻信號的驅動信號、每個聲源相對于坐標原點的方位角、每個聲源相對于坐標原點的高度角、每個聲源相對于坐標原點的空間直線距離輸入到反饋模塊F的參考信號產生器R,參考聲源S的每個聲源受到驅動信號的驅動發出的聲波廣播至空間時,麥克風陣列A接收到聲波后收錄為L幀的音頻信號輸送給深度神經網絡全景聲編碼模塊N中,評價器E依據統計學指標得出差異性評價誤差,如果差異性評價誤差小于設置值,返回麥克風陣列A當前空間聲場信號的全景音頻編碼。
本發明授權一種基于深度學習的全景音頻編碼方法在權利要求書中公布了:1.一種基于深度學習的全景音頻編碼方法,同一個空間中存在多個聲源組成的參考聲源S和多個陣元組成的麥克風陣列A,以麥克風陣列A的第一個陣元位置或麥克風陣列A的幾何中心作為坐標原點建立三維直角坐標系,x軸和y軸為坐標原點所在水平面上的任意兩條垂直的直線,z軸為垂直于坐標原點所在水平面上的一條直線,x軸、y軸、z軸的方向任意指定,其特征在于:包括如下步驟: 步驟一、將每個聲源產生L幀的音頻信號的驅動信號、每個聲源相對于坐標原點的方位角、每個聲源相對于坐標原點的高度角、每個聲源相對于坐標原點的空間直線距離輸入到反饋模塊F的參考信號產生器R,反饋模塊F的參考信號產生器R生成一個行數為m,列數為L的矩陣REF,矩陣REF的每一行為沿時間先后排列的同一個參考信號球諧域分量,矩陣REF的每一列為同一時刻按次序排列的不同的參考信號球諧分量; 步驟二、參考聲源S的每個聲源受到驅動信號的驅動發出的聲波廣播至空間時,麥克風陣列A接收到聲波后收錄為L幀的音頻信號輸送給深度神經網絡全景聲編碼模塊N中,陣元的數量與聲源的數量相同或者不同,深度神經網絡全景聲編碼模塊N的輸入是一個行數等于陣元數量列數為L的矩陣I,矩陣I的每一行為麥克風陣列A的同一個陣元所接收到的沿時間先后排列的信號幅值,矩陣I的每一列為同一時刻按次序排列的不同陣元接收到的信號幅值,深度神經網絡全景聲編碼模塊N的輸出是一個行數為m,列數為L的矩陣O,m為信號球諧分解的通道數,矩陣O的每一行為沿時間先后排列的同一個輸出信號球諧域分量,矩陣O的每一列為同一時刻按次序排列的不同的輸出信號球諧域分量; 步驟三、將矩陣O和矩陣REF輸入到反饋模塊F的評價器E中,評價器E依據統計學指標得出矩陣O和矩陣REF的差異性評價誤差loss,如果差異性評價誤差loss小于設置值ε或連續返回步驟一u次每次差異性評價誤差loss下降量小于設置值σ時,矩陣O為麥克風陣列A當前空間聲場信號的全景音頻編碼,否則,改變參考聲源S的自身位置后,返回到步驟一。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人蘇州鴻鵠騏驥電子科技有限公司,其通訊地址為:215008 江蘇省蘇州市姑蘇區蘇站路錦堂街8號0800室(B20);或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。