1

我想阅读具有原始内容的pdf文件,例如其字体(可能某些字体很小,而某些字体很大)以及段落和表格(如果是)。

怎么可能。

请帮忙。

4

1 回答 1

0

您需要一个诸如jPod 之类的库,它可以将 PDF 文档解析回生成它们的结构。PDF 规范非常复杂,但是如果您只想抓取文本以及可能一两个字体大小,那应该不难做到。

于 2010-05-21T09:43:45.547 回答