Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我有 100 个 pdf,但每个 pdf 有 40 页,即。它没有被处理。实际上,我们正在尝试使用猪 Udf?? 我们可以使用 Pig Udf 拆分 PDF 文件吗?
不。虽然我对 Pig 不是很熟悉,但它似乎并不能原生地理解 PDF 文件格式,它的目的是存储和分析数据,而不是处理文件。
您可以将 Pig 与另一个理解 PDF 的库结合使用以拆分 PDF,尽管拆分 PDF,Pig 不是必需的,这完全取决于使用 Pig 的工作流程/目的是什么。