2

我正在寻找一个 java 实用程序,用户可以通过它转换任何类型的文件(pdf、doc、docx、xls、xlsx、csv、rtf、txt)。我们有一个要求,用户可以上传任何类型的文件,我们需要读取文件的内容(仅文本),将其转换并存储在一个对象中。这可以使用 Apachi poi 来完成,但我想知道是否存在任何 java 实用程序?

4

2 回答 2

4

您可能对Apache Tika感兴趣,它包含 Apache POI 和 PDFBox 的功能。从项目描述来看,该工具包:“使用现有的解析器库从各种文档中检测并提取元数据和结构化文本内容。

于 2013-02-25T16:25:52.677 回答
0

我想你不能对每种类型的文件都有某种通用功能。您将需要为每种文件类型实现转换方法。此链接对 PDF 文件有帮助,还会为您提供一个模板来处理您的其他文件类型。

于 2013-02-25T16:12:06.957 回答