北京大數(shù)元科技發(fā)展有限公司胡杞燚獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉北京大數(shù)元科技發(fā)展有限公司申請(qǐng)的專利一種表格圖片數(shù)據(jù)解析方法、裝置及存儲(chǔ)介質(zhì)獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN114066868B 。
龍圖騰網(wǎng)通過國家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-08-19發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202111396224.5,技術(shù)領(lǐng)域涉及:G06T7/00;該發(fā)明授權(quán)一種表格圖片數(shù)據(jù)解析方法、裝置及存儲(chǔ)介質(zhì)是由胡杞燚;陳國強(qiáng);姬永杰;朱培冬;王長勇設(shè)計(jì)研發(fā)完成,并于2021-11-23向國家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。
本一種表格圖片數(shù)據(jù)解析方法、裝置及存儲(chǔ)介質(zhì)在說明書摘要公布了:本發(fā)明公開了一種表格圖片數(shù)據(jù)解析方法、裝置及存儲(chǔ)介質(zhì),該方法包括:獲取表格圖片,對(duì)表格圖片進(jìn)行降噪及傾斜矯正處理;計(jì)算表格圖片中每個(gè)單元格的位置信息并對(duì)單元格進(jìn)行裁切;識(shí)別每個(gè)單元格中的字符內(nèi)容并將字符內(nèi)容與單元格位置信息進(jìn)行關(guān)聯(lián)存儲(chǔ)。實(shí)施本發(fā)明的表格圖片數(shù)據(jù)解析方法,獲取表格圖片,通過拆分表格圖片為單個(gè)獨(dú)立的單元格圖片切片,再對(duì)單元格圖片切片進(jìn)行文字識(shí)別,并對(duì)應(yīng)保存單元格位置信息和文字信息。通過本方法描述的各步驟,解決了傳統(tǒng)圖像識(shí)別中對(duì)整張圖片進(jìn)行整體識(shí)別而忽略了表格邊框線的作用,導(dǎo)致丟失了表格的結(jié)構(gòu)化信息的弊端。從而達(dá)到對(duì)帶有表格的圖片解析時(shí),提高結(jié)構(gòu)化的程度,減少數(shù)據(jù)丟失的效果。
本發(fā)明授權(quán)一種表格圖片數(shù)據(jù)解析方法、裝置及存儲(chǔ)介質(zhì)在權(quán)利要求書中公布了:1.一種表格圖片數(shù)據(jù)解析方法,其特征在于,所述方法包括: 獲取表格圖片,對(duì)所述表格圖片進(jìn)行降噪及傾斜矯正處理; 計(jì)算表格圖片中每個(gè)單元格的位置信息并對(duì)單元格進(jìn)行裁切; 識(shí)別每個(gè)單元格中的字符內(nèi)容并將所述字符內(nèi)容與單元格位置信息進(jìn)行關(guān)聯(lián)存儲(chǔ); 所述對(duì)所述表格圖片進(jìn)行降噪及傾斜矯正處理的步驟具體包括: 對(duì)所述表格圖片進(jìn)行二值化處理以及膨脹、腐蝕操作,去除表格圖片中的文字及干擾信息; 獲取所述表格圖片中的橫線和縱線,分別得到橫線圖、縱線圖及原圖; 對(duì)橫線圖或縱線圖求橫線或縱線的平均傾斜角; 根據(jù)所述平均傾斜角對(duì)所述橫線圖、縱線圖及原圖進(jìn)行傾斜矯正; 所述計(jì)算表格圖片中每個(gè)單元格的位置信息并對(duì)單元格進(jìn)行裁切的步驟包括: 計(jì)算橫線圖和縱線圖中坐標(biāo)相同的像素點(diǎn),獲得橫線和縱線的全部交點(diǎn); 將全部交點(diǎn)的坐標(biāo)按順序保持為交點(diǎn)數(shù)組; 將橫線圖和縱線圖中所有像素點(diǎn)的坐標(biāo)保存為表格邊框數(shù)組; 所述將全部交點(diǎn)的坐標(biāo)按順序保持為交點(diǎn)數(shù)組的步驟具體包括: 獲取全部交點(diǎn)的坐標(biāo)信息,將全部交點(diǎn)中縱坐標(biāo)相同的交點(diǎn)作為一行,將所述全部交點(diǎn)按行劃分為多行; 將每一行中的交點(diǎn)按橫坐標(biāo)從小到大進(jìn)行排序,將每行按縱坐標(biāo)從小到大進(jìn)行排序,形成所述交點(diǎn)數(shù)組; 所述計(jì)算表格圖片中每個(gè)單元格的位置信息并對(duì)單元格進(jìn)行裁切的步驟具體包括: 從所述交點(diǎn)數(shù)組和表格邊框數(shù)組中計(jì)算單元格左上角頂點(diǎn)、右上角頂點(diǎn)、右下角頂點(diǎn)和左下角頂點(diǎn); 根據(jù)所述左上角頂點(diǎn)、右上角頂點(diǎn)、右下角頂點(diǎn)和左下角頂點(diǎn)坐標(biāo)對(duì)單元格進(jìn)行裁切; 所述從所述交點(diǎn)數(shù)組和表格邊框數(shù)組中計(jì)算單元格左上角頂點(diǎn)的步驟具體包括: 取第n行交點(diǎn)數(shù)組中第m個(gè)點(diǎn)的坐標(biāo)信息,記為點(diǎn)AXm,Yn; 獲取第n行交點(diǎn)數(shù)組中的第m+1個(gè)點(diǎn)的坐標(biāo)信息Xm+1,Yn; 計(jì)算第n行第m個(gè)點(diǎn)和第n行第m+1個(gè)點(diǎn)的中心點(diǎn)坐標(biāo)(Xm+Xm+12,Yn); 判斷所述表格邊框數(shù)組中是否存在所述中心點(diǎn)坐標(biāo)(Xm+Xm+12,Yn); 若存在,則認(rèn)為點(diǎn)A為左上角頂點(diǎn); 若不存在,則舍棄點(diǎn)A,取第n行交點(diǎn)數(shù)組中第m+1個(gè)點(diǎn)記為點(diǎn)A重復(fù)執(zhí)行上述步驟。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人北京大數(shù)元科技發(fā)展有限公司,其通訊地址為:100000 北京市海淀區(qū)西北旺東路10號(hào)院東區(qū)10號(hào)樓6層6-18室;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 深圳市光羿科技有限公司張凡獲國家專利權(quán)
- 歌爾科技有限公司王偉獲國家專利權(quán)
- 德克薩斯儀器股份有限公司S·普魯索塔曼獲國家專利權(quán)
- 西門子能源全球有限公司M.斯佩斯獲國家專利權(quán)
- 吳勇軍獲國家專利權(quán)
- 廣東德昌電機(jī)有限公司秦銳鋒獲國家專利權(quán)
- 上海市政工程設(shè)計(jì)研究總院(集團(tuán))有限公司岳貴平獲國家專利權(quán)
- 上海宇晝科技有限公司陳加成獲國家專利權(quán)
- 華為技術(shù)有限公司基多·蒙托里西獲國家專利權(quán)
- 蘇州肺盾醫(yī)療科技有限公司博爾夏特·拉爾夫獲國家專利權(quán)