0

我有 100 个 pdf,但每个 pdf 有 40 页,即。它没有被处理。实际上,我们正在尝试使用猪 Udf?? 我们可以使用 Pig Udf 拆分 PDF 文件吗?

4

1 回答 1

0

不。虽然我对 Pig 不是很熟悉,但它似乎并不能原生地理解 PDF 文件格式,它的目的是存储和分析数据,而不是处理文件。

您可以将 Pig 与另一个理解 PDF 的库结合使用以拆分 PDF,尽管拆分 PDF,Pig 不是必需的,这完全取决于使用 Pig 的工作流程/目的是什么。

于 2016-05-04T19:26:36.217 回答