0

我有一个富文本文档(.rtf 或 .doc),其中包含许多需要读取并转换为 XML 或 Json 结构化数据对象的数据元素。这些文档在数据方面具有一定的格式。是否有任何库可用于使用 java 进行转换。有人遇到过这种情况吗?

有没有人试过 Apache POI 或 Apache Tika 转换成 XML

4

2 回答 2

0

我建议查看RTF Parser Kit,您可以使用它来填充适合进一步处理或持久性的 Java 数据结构。

于 2020-02-22T21:13:34.910 回答
0

我会把这个任务分成两个解析器和两个序列化器

  1. 将 rtf 解析为 java 模型
  2. 将文档解析为 java 模型
  3. 将java模型序列化为xml
  4. 将java模型序列化为json

对于 1&2 来说,使用POI是非常标准的。对于 3&4,你有更多的选择,一个流行的选择是杰克逊

于 2020-02-20T23:58:12.793 回答