解螺旋(上海)科技有限公司梁翠霞獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉解螺旋(上海)科技有限公司申請的專利基于人工智能的文獻結構化提取方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120336416B 。
龍圖騰網通過國家知識產權局官網在2025-08-19發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510820361.9,技術領域涉及:G06F16/25;該發明授權基于人工智能的文獻結構化提取方法及系統是由梁翠霞;王子軒;牟蕾;葉思慧設計研發完成,并于2025-06-19向國家知識產權局提交的專利申請。
本基于人工智能的文獻結構化提取方法及系統在說明書摘要公布了:本發明提供一種基于人工智能的文獻結構化提取方法及系統,旨在解決現有文獻處理技術中信息提取不全面、不準確的問題,首先獲取包含多個文獻單元的原始文獻數據集合,并進行預處理得到標準化文獻數據集合,接著,調用預訓練的文獻特征提取模型處理標準化文獻數據,提取文獻單元的內容特征和結構特征,基于文獻單元的內容特征和結構特征,執行結構化解析處理以生成包含主題要素、邏輯關系要素和關鍵信息要素的結構化要素集合,最后,對結構化要素集合進行整合優化處理,生成包含要素關聯關系的最終結構化文獻結果,由此實現了文獻信息的自動化、結構化提取,提高了文獻處理的效率和準確性,為文獻的智能化管理和應用提供了新途徑。
本發明授權基于人工智能的文獻結構化提取方法及系統在權利要求書中公布了:1.一種基于人工智能的文獻結構化提取方法,其特征在于,所述方法包括: 獲取原始文獻數據集合,所述原始文獻數據集合包含多個文獻單元,每個文獻單元由文本內容和元信息組成; 對所述原始文獻數據集合進行預處理,得到標準化文獻數據集合,所述標準化文獻數據集合包含統一格式的文本段落和元信息條目; 調用預訓練的文獻特征提取模型處理所述標準化文獻數據集合,得到所述文獻單元的內容特征和結構特征; 基于所述內容特征和所述結構特征執行結構化解析處理,生成所述文獻單元的結構化要素集合,所述結構化要素集合包含主題要素、邏輯關系要素和關鍵信息要素; 對所述結構化要素集合進行整合優化處理,生成包含要素關聯關系的最終結構化文獻結果; 所述基于所述內容特征和所述結構特征執行結構化解析處理,生成所述文獻單元的結構化要素集合,所述結構化要素集合包含主題要素、邏輯關系要素和關鍵信息要素,包括: 將所述內容特征輸入主題識別模塊,通過主題詞提取和主題分布概率計算操作生成主題要素,所述主題要素包含核心主題詞和主題覆蓋范圍描述; 將所述結構特征輸入邏輯解析模塊,通過段落關聯分析和章節層級識別操作生成邏輯關系要素,所述邏輯關系要素包含段落間推導關系和章節間從屬關系; 將所述內容特征和所述結構特征輸入關鍵信息抽取模塊,通過實體識別和關鍵句篩選操作生成關鍵信息要素,所述關鍵信息要素包含核心研究結論和關鍵實驗條件; 對所述主題要素、所述邏輯關系要素和所述關鍵信息要素進行沖突檢測處理,識別不同要素之間的語義矛盾點; 基于所述語義矛盾點對所述主題要素、所述邏輯關系要素和所述關鍵信息要素進行修正處理,生成一致性校驗通過的結構化要素集合。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人解螺旋(上海)科技有限公司,其通訊地址為:200233 上海市徐匯區田林路140號T2商辦樓15層1501室;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。