1

我正在寻找一种能够产生尽可能接近原始结果的解决方案,例如这个示例,它转换 .doc 而不是 .ppt 文件。理想情况下,它应该接收 a并使用所需的 html 代码FileInputStream输出 a 。String

我遇到了这个问题,它发布的代码与 Apache POI 网站上的代码非常相似,但是它转换为图像,我无法重新调整它的用途。

否则,似乎几乎没有代码可以做到这一点。

编辑:

我已经尝试实现 Apache Tika 解决方案,但是我在使用解析器时遇到了问题。我已经看到有几个人在 Android 上实现这个库时遇到了这个问题,但是我还没有看到有人提出解决方案。

我的代码如下:

        HSLFSlideShow powerpointDoc = new HSLFSlideShow(inputDocument);
        inputDocument.close();

        List<HSLFSlide> slides = powerpointDoc.getSlides();
        ContentHandler handler = new ToXMLContentHandler();
        AutoDetectParser parser = new AutoDetectParser();
        Metadata metadata = new Metadata();

        for (int i = 0; i <= slides.size(); i++) {
            parser.parse(inputDocument, handler, metadata);
        }

        String result = handler.toString();

谁能提供我如何使用 Apache Tika 的示例?

4

0 回答 0