有谁知道可用于将 PDF 文档转换为 Java 中的 RTF 的易于使用的库或 SDK?
问问题
6162 次
2 回答
2
再看一下 iText(我知道不支持直接 PDF -> RTF 转换 - 但请继续阅读以了解脊椎刺痛的可能性!)。
去年我们在 iText 中添加了一个 PDF 文本解析模块。现在,这有点初级,但它确实有效,并且很容易扩展。
iText 擅长生成 RTF。
所以......从PDF解析文本并基于解析创建RTF应该相对简单(不容易,但简单)。
如果您必须保留字体之类的内容,则需要做更多的工作(PDF 解析器确实提供字体信息,以及每段文本的页面位置),但我怀疑 iText 的 RTF 生成器会简化很多那。
如果您的 PDF 包含您需要带入 RTF 的嵌入式图像,则当前的 PDF 解析器实际上并没有做太多的事情 - 但它有足够的钩子让它发生在一点点麻烦的情况下。
所以我会说 iText 最有可能做你正在寻找的东西,并将帮助你实现本地最小的开发工作,但我不会把它放在超级简单的类别中......听起来是一个不错的挑战,实际上。
如果你最终实现了这样的东西,在你有机会玩一点之后,请随时向我提出问题/想法。如果您最终获得了一些不错的转换代码,我们可能希望将其添加到 iText。
如果你只是想把它拿出来,而且你有钱可以花钱,我相信有很多商业转换器可以满足你的需求。可能不会便宜,但可能比您的开发时间便宜。
于 2009-07-15T07:04:17.687 回答