Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我想阅读具有原始内容的pdf文件,例如其字体(可能某些字体很小,而某些字体很大)以及段落和表格(如果是)。
怎么可能。
请帮忙。
您需要一个诸如jPod 之类的库,它可以将 PDF 文档解析回生成它们的结构。PDF 规范非常复杂,但是如果您只想抓取文本以及可能一两个字体大小,那应该不难做到。