廈門理工學院;廈門美圖之家科技有限公司;廈門大學王大寒獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉廈門理工學院;廈門美圖之家科技有限公司;廈門大學申請的專利一種緩解多模態大模型幻覺的訓練方法、裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120258071B 。
龍圖騰網通過國家知識產權局官網在2025-08-15發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510718228.2,技術領域涉及:G06N3/08;該發明授權一種緩解多模態大模型幻覺的訓練方法、裝置是由王大寒;趙啟延;劉洛麒;余清洲;張煦堯;王菡子;朱順痣設計研發完成,并于2025-05-30向國家知識產權局提交的專利申請。
本一種緩解多模態大模型幻覺的訓練方法、裝置在說明書摘要公布了:本發明提供了一種緩解多模態大模型幻覺的訓練方法、裝置,涉及多模態大模型訓練技術領域,該方法通過重新定義圖像標記之間的位置關系,引入二維曼哈頓距離計算,優化了傳統一維位置編碼的不足,保留了圖像的空間局部性特征。同時,通過改進因果注意力掩碼,進一步提升了模型對圖像與文本信息的融合能力。在模型訓練過程中采用凍結預訓練模塊并逐步微調的策略,顯著提高了模型的多模態對齊效果,降低了幻覺現象的發生率,為構建更可靠、更高效的多模態人工智能系統提供了新的技術路徑。旨在解決現有技術中多模態大模型因位置編碼方式導致的幻覺問題。
本發明授權一種緩解多模態大模型幻覺的訓練方法、裝置在權利要求書中公布了:1.一種緩解多模態大模型幻覺的訓練方法,其特征在于,包括: 獲取圖像數據,并將所述圖像數據傳入多模態大模型中,對所述圖像數據進行編碼處理,得到多個圖像標記; 計算各圖像標記之間的相對位置距離,并將該相對位置距離從一維層面演變至二維層面,得到二維坐標曼哈頓距離; 對圖像標記進行光柵掃描處理,對位置索引進行分配,并重新給圖像標記分配二維位置坐標; 對所述二維坐標曼哈頓距離進行等價轉換處理,并將光柵掃描的位置索引替換成重新分配的圖像標記的二維位置坐標的坐標值之和; 根據新的位置索引和轉換后的二維坐標曼哈頓距離,對因果注意力掩碼進行建模,并將默認的因果注意掩碼替換成新建模的因果注意力掩碼; 凍結所述多模態大模型,根據替換后的因果注意力掩碼以及預設的預訓練數據對所述多模態大模型進行調整訓練預處理,直至所述多模態大模型達到預設效果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人廈門理工學院;廈門美圖之家科技有限公司;廈門大學,其通訊地址為:361024 福建省廈門市集美區理工路600號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。