1

我在解析这个 pdf 文件时遇到问题:

http://www.transperfect.com/sites/default/files/imported/pdf/Tokyo_Client_Services_Representative.pdf

在我对 FlateDecode 解码的 pdf 文件进行编码后,输出是这样的:

在此处输入图像描述

通常很容易解析内容,因为文本内容总是在打开的“(”和关闭的“)”括号内,但这个 pdf 文件让我头疼。括号内似乎只有控制字符。

我当前的输出如下:

在此处输入图像描述

这里有人对此有所了解吗?我究竟做错了什么 ?

4

0 回答 0