我想从 OCR 数据中提取表格信息,我有原始文本,它是文本。我尝试了 pytesseract 但找不到实际的实现。
这是一张图片:https ://drive.google.com/open?id=1CGJwbmf5snoXvwlQAsRAxIRRixbT_Q8l
我试过这个:https ://github.com/WZBSocialScienceCenter/pdftabextract
这种方法对我根本不起作用。
我想从 OCR 数据中获得该表的表格结构,以供我进一步处理。
我想从 OCR 数据中提取表格信息,我有原始文本,它是文本。我尝试了 pytesseract 但找不到实际的实现。
这是一张图片:https ://drive.google.com/open?id=1CGJwbmf5snoXvwlQAsRAxIRRixbT_Q8l
我试过这个:https ://github.com/WZBSocialScienceCenter/pdftabextract
这种方法对我根本不起作用。
我想从 OCR 数据中获得该表的表格结构,以供我进一步处理。