Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在尝试将 PDF 作为文本读取,并且可以将其中的垃圾写回,这很好,因为我有一个解析器组件来获取我需要的位。
我的问题是如何阅读 PDF 的特定部分而忽略其余部分?
如果您的 PDF 格式正确,您可以使用文本抓取来完成,但这意味着您需要打开 PDF 文件并且它必须是可见的,原生抓取才能工作