我正在寻找一种能够产生尽可能接近原始结果的解决方案,例如这个示例,它转换 .doc 而不是 .ppt 文件。理想情况下,它应该接收 a并使用所需的 html 代码FileInputStream
输出 a 。String
我遇到了这个问题,它发布的代码与 Apache POI 网站上的代码非常相似,但是它转换为图像,我无法重新调整它的用途。
否则,似乎几乎没有代码可以做到这一点。
编辑:
我已经尝试实现 Apache Tika 解决方案,但是我在使用解析器时遇到了问题。我已经看到有几个人在 Android 上实现这个库时遇到了这个问题,但是我还没有看到有人提出解决方案。
我的代码如下:
HSLFSlideShow powerpointDoc = new HSLFSlideShow(inputDocument);
inputDocument.close();
List<HSLFSlide> slides = powerpointDoc.getSlides();
ContentHandler handler = new ToXMLContentHandler();
AutoDetectParser parser = new AutoDetectParser();
Metadata metadata = new Metadata();
for (int i = 0; i <= slides.size(); i++) {
parser.parse(inputDocument, handler, metadata);
}
String result = handler.toString();
谁能提供我如何使用 Apache Tika 的示例?