北京北大軟件工程股份有限公司吳宇鵬獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉北京北大軟件工程股份有限公司申請的專利一種檔案的數(shù)字化處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN120071376B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-08-19發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202510511974.4,技術(shù)領(lǐng)域涉及:G06V30/42;該發(fā)明授權(quán)一種檔案的數(shù)字化處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品是由吳宇鵬;劉柳;張冬設(shè)計研發(fā)完成,并于2025-04-23向國家知識產(chǎn)權(quán)局提交的專利申請。
本一種檔案的數(shù)字化處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品在說明書摘要公布了:本申請公開了一種檔案的數(shù)字化處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品,涉及圖像識別技術(shù)領(lǐng)域,該方法包括從預(yù)先采集的檔案圖像中確定多個文本塊;將所述多個文本塊輸入至預(yù)先訓(xùn)練的排列語言模型,得到所述排列語言模型輸出的每個文本塊的文字?位置相關(guān)信息;其中,一個文字?位置相關(guān)信息中包括一個文本塊中包含的每個文字處于該文本塊中不同位置的概率;基于所述文字?位置相關(guān)信息,對每個文本塊中的文字位置進(jìn)行調(diào)整,得到每個文本塊的文本內(nèi)容;使用每個文本內(nèi)容生成與所述檔案圖像對應(yīng)的數(shù)字檔案,本申請可以提升檔案數(shù)字化處理的效率和準(zhǔn)確性。
本發(fā)明授權(quán)一種檔案的數(shù)字化處理方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品在權(quán)利要求書中公布了:1.一種檔案的數(shù)字化處理方法,其特征在于,所述檔案的數(shù)字化處理方法包括: 從預(yù)先采集的檔案圖像中確定多個文本塊; 將所述多個文本塊輸入至預(yù)先訓(xùn)練的排列語言模型,得到所述排列語言模型輸出的每個文本塊的文字-位置相關(guān)信息;其中,一個文字-位置相關(guān)信息中包括一個文本塊中包含的每個文字處于該文本塊中不同位置的概率; 基于所述文字-位置相關(guān)信息,對每個文本塊中的文字位置進(jìn)行調(diào)整,得到每個文本塊的文本內(nèi)容; 使用每個文本內(nèi)容生成與所述檔案圖像對應(yīng)的數(shù)字檔案; 以及,所述檔案的數(shù)字化處理方法還包括: 對所述檔案圖像進(jìn)行人臉目標(biāo)檢測,得到所述檔案圖像中的人臉區(qū)域; 從所述人臉區(qū)域中進(jìn)行人像摳圖操作,得到目標(biāo)人臉圖像; 將所述目標(biāo)人臉圖像與預(yù)先確定的背景圖像相融合,得到融合人臉圖像; 從所述數(shù)字檔案中確定人臉圖像位置; 將所述融合人臉圖像融合至所述數(shù)字檔案中的所述人臉圖像位置處,得到包含所述融合人臉圖像的目標(biāo)數(shù)字檔案; 其中,將多個文本塊中的一個目標(biāo)文本塊輸入至預(yù)先訓(xùn)練的排列語言模型,得到所述排列語言模型輸出的所述目標(biāo)文本塊的文字-位置相關(guān)信息,具體包括: 確定多個文本塊中的一個目標(biāo)文本塊中包含的每個文字以及每個文字在所述目標(biāo)文本塊中的初始位置; 根據(jù)所述每個文字以及每個文字在所述目標(biāo)文本塊中的初始位置,確定每個文字的詞元編碼以及每個文字的隱狀態(tài)組合信息;其中,所述隱狀態(tài)組合信息包括所述隱狀態(tài)組合信息對應(yīng)的文字的前向隱狀態(tài)和后向隱狀態(tài); 基于每個文字的詞元編碼以及每個文字的隱狀態(tài)組合信息,計算得到所述目標(biāo)文本塊的文字-位置相關(guān)信息; 以及,所述使用每個文本內(nèi)容生成與所述檔案圖像對應(yīng)的數(shù)字檔案,具體包括: 對每個文本內(nèi)容進(jìn)行類型識別,得到每個文本內(nèi)容的文本類型;其中,所述文本類型包括標(biāo)簽類型和內(nèi)容類型; 確定每個文本內(nèi)容在所述檔案圖像中的坐標(biāo)信息; 根據(jù)每個文本內(nèi)容的坐標(biāo)信息,將一個內(nèi)容類型的文本內(nèi)容與一個標(biāo)簽類型的文本內(nèi)容進(jìn)行關(guān)聯(lián);其中,所述一個內(nèi)容類型的文本內(nèi)容與所述一個標(biāo)簽類型的文本內(nèi)容的距離最近; 獲取預(yù)先設(shè)置的數(shù)字檔案模板;其中,所述數(shù)字檔案模板中包含多個目標(biāo)標(biāo)簽; 重復(fù)執(zhí)行填寫操作,直至所述數(shù)字檔案模板中的每個目標(biāo)標(biāo)簽對應(yīng)的空白區(qū)域均填寫有文本內(nèi)容,得到與所述檔案圖像對應(yīng)的數(shù)字檔案: 其中,所述填寫操作具體包括: 從多個目標(biāo)標(biāo)簽中確定一個當(dāng)前目標(biāo)標(biāo)簽; 從標(biāo)簽類型的文本內(nèi)容中確定與所述當(dāng)前目標(biāo)標(biāo)簽相同的目標(biāo)文本內(nèi)容; 將所述目標(biāo)文本內(nèi)容對應(yīng)的內(nèi)容類型的文本內(nèi)容填寫到與所述當(dāng)前目標(biāo)標(biāo)簽對應(yīng)的空白區(qū)域內(nèi)。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人北京北大軟件工程股份有限公司,其通訊地址為:100080 北京市海淀區(qū)北四環(huán)西路67號中關(guān)村國際創(chuàng)新大廈11層1101-1103、1106-1108室;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 特靈國際有限公司S·A·庫杰克獲國家專利權(quán)
- 西門子股份公司V·托切爾獲國家專利權(quán)
- 慧與發(fā)展有限責(zé)任合伙企業(yè)N·愛德華茲獲國家專利權(quán)
- 深圳市比克動力電池有限公司林森獲國家專利權(quán)
- 長鑫存儲技術(shù)有限公司請求不公布姓名獲國家專利權(quán)
- 福特全球技術(shù)公司阿迪希亞·普拉瓦倫·雷·蘭加獲國家專利權(quán)
- 中興通訊股份有限公司閆盛男獲國家專利權(quán)
- 杭州巨星科技股份有限公司李躍明獲國家專利權(quán)
- 賽普拉斯半導(dǎo)體公司阿爾溫德·斯里德哈蘭獲國家專利權(quán)
- 費(fèi)希爾控制產(chǎn)品國際有限公司L·D·米勒獲國家專利權(quán)