PDF 文件包含文本,不是扫描图像。我一直在尝试使用Camelot,但没有成功。lattice
风味不起作用,因为没有垂直线并且风味stream
无法正确分隔行。我玩过,row_tol
但由于行的高度不同,它不适用于所有行。
有没有办法使用该lattice
方法但考虑垂直线的列分隔符?还是有另一种提取表格的方法?
PDF 文件包含文本,不是扫描图像。我一直在尝试使用Camelot,但没有成功。lattice
风味不起作用,因为没有垂直线并且风味stream
无法正确分隔行。我玩过,row_tol
但由于行的高度不同,它不适用于所有行。
有没有办法使用该lattice
方法但考虑垂直线的列分隔符?还是有另一种提取表格的方法?