21

我有 python 代码使用tabula-py读取 PDF 以提取文本,然后通过 tabula-py 将其更改为表格形式。但这给了我一个警告。

Nov 15, 2017 3:40:23 PM org.apache.pdfbox.pdmodel.font.PDSimpleFont toUnicode
WARNING: No Unicode mapping for .notdef (9) in font Helvetica

此警告是关于tabula-py 的,并且Tabula-py是用 Java 编写的。所以我不能简单地使用-W ignore来抑制上述警告。

有什么办法可以消除或抑制上述警告。

4

3 回答 3

7

tabula-py 作者在这里。设置silent=True禁止 tabula-java 日志。另见: https ://github.com/chezou/tabula-py/blob/e11d6f0ac518810b6d92b60a815e34f32f6bf085/tabula/io.py#L65 https://tabula-py.readthedocs.io/en/latest/tabula.html#tabula。 io.build_options

于 2020-02-29T17:38:53.240 回答
2

试试这个可能会有所帮助:

import warnings
warnings.filterwarnings('ignore')
于 2020-04-04T06:04:29.240 回答
1

Tabula 提供了一个内置功能来抑制 java 警告。

silent=True请求中的尝试参数:

tabula.read_pdf("/path/to/sample.pdf", pages="all", silent=True)

文档来源

于 2020-08-07T14:15:04.773 回答