語聯(lián)網(wǎng)(武漢)信息技術有限公司陳斯獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉語聯(lián)網(wǎng)(武漢)信息技術有限公司申請的專利多模態(tài)數(shù)據(jù)的分類方法及裝置獲國家發(fā)明授權專利權,本發(fā)明授權專利權由國家知識產(chǎn)權局授予,授權公告號為:CN116049518B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權局官網(wǎng)在2025-08-12發(fā)布的發(fā)明授權授權公告中獲悉:該發(fā)明授權的專利申請?zhí)?專利號為:202111254740.4,技術領域涉及:G06F16/906;該發(fā)明授權多模態(tài)數(shù)據(jù)的分類方法及裝置是由陳斯設計研發(fā)完成,并于2021-10-27向國家知識產(chǎn)權局提交的專利申請。
本多模態(tài)數(shù)據(jù)的分類方法及裝置在說明書摘要公布了:本發(fā)明提供一種多模態(tài)數(shù)據(jù)的分類方法及裝置,其中,該方法包括:基于待分類多模態(tài)數(shù)據(jù)的類型,對于待分類多模態(tài)數(shù)據(jù)中每一目標對象,生成攜帶有目標對象的位置信息的第一矩陣;基于第一矩陣和目標對象的特征向量,獲取第一向量;將各第一向量輸入分類模型,獲取待分類多模態(tài)數(shù)據(jù)的分類結果;其中,待分類多模態(tài)數(shù)據(jù)的類型包括文本、音頻、圖片或視頻;第一矩陣為旋轉矩陣。本發(fā)明提供的多模態(tài)數(shù)據(jù)的分類方法及裝置,通過旋轉矩陣攜帶目標對象的位置信息的方式,進行位置嵌入,基于多模態(tài)數(shù)據(jù)的類型,選擇更強檔的位置信息編碼和嵌入的方式,能降低計算的復雜性,不會分散位置信息,能提高分類模型的性能,能提高多模態(tài)數(shù)據(jù)分類的效率和準確率。
本發(fā)明授權多模態(tài)數(shù)據(jù)的分類方法及裝置在權利要求書中公布了:1.一種多模態(tài)數(shù)據(jù)的分類方法,其特征在于,包括: 基于待分類多模態(tài)數(shù)據(jù)的類型,對于所述待分類多模態(tài)數(shù)據(jù)中每一目標對象,生成攜帶有所述目標對象的位置信息的第一矩陣; 基于所述第一矩陣和所述目標對象的特征向量,獲取第一向量; 將各所述第一向量輸入分類模型,獲取所述待分類多模態(tài)數(shù)據(jù)的分類結果; 其中,所述待分類多模態(tài)數(shù)據(jù)的類型包括文本、音頻、圖片或視頻;所述第一矩陣為旋轉矩陣; 所述基于待分類多模態(tài)數(shù)據(jù)的類型,對于所述待分類多模態(tài)數(shù)據(jù)中每一目標對象,生成攜帶有所述目標對象的位置信息的第一矩陣,具體包括: 根據(jù)所述目標對象的位置信息和三角函數(shù),生成第一維數(shù)的所述第一矩陣;其中,所述第一維數(shù)是根據(jù)所述待分類多模態(tài)數(shù)據(jù)的類型確定的; 所述根據(jù)所述目標對象的位置信息和三角函數(shù),生成所述第一矩陣,具體包括: 在所述待分類多模態(tài)數(shù)據(jù)的類型為視頻的情況下,根據(jù)如下公式生成所述第一矩陣 ; 其中,表示目標對象的空間位置信息;k表示目標對象的時間位置信息;Rm,n,k表示第一矩陣;θ表示基準角度;。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯(lián)系本專利的申請人或專利權人語聯(lián)網(wǎng)(武漢)信息技術有限公司,其通訊地址為:430206 湖北省武漢市江夏區(qū)東湖高新技術開發(fā)區(qū)高新大道999號武漢未來科技城B區(qū)B2棟B座;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。