0

使用 Apache POI 和 docx4j 读取 doc 文件。

我已经使用 docx4j 甚至使用 Apache POI 阅读了 doc 文件,但问题是当我从中提取数据时它只返回TEXT而不是Images。甚至我没有任何新段落开始或段落结束的符号..

有什么解决办法吗。。

4

1 回答 1

0

从我读到的问题来看,从文档返回的数据只是文本(字符串类型),这是因为在位图中输入的数据也是一个字符数组。

您可能想要使用一个解析器来识别字符序列并将其呈现为位图扩展。

于 2012-04-06T11:39:36.010 回答