在这个问题中,有人遇到了类似的问题:我想读取 .pptx 文件的内容(仅文本),但只能使用 .ppt 文件。所以我试图用接受的答案来解决它,但我得到了这个例外:java.lang.ClassNotFoundException: org.apache.poi.hslf.model.TextPainter$Key
我使用了此页面中的示例(已在接受的答案中提出),所以我不知道为什么它不起作用。我的代码:
public static String readPPTX(String path) throws FileNotFoundException, IOException{
XMLSlideShow ppt = new XMLSlideShow(new FileInputStream(path));
String content = "";
XSLFSlide[] slides = ppt.getSlides();
for (XSLFSlide slide : slides){
XSLFShape[] sh = slide.getShapes();
for (int j = 0; j < sh.length; j++){
if (sh[j] instanceof XSLFTextShape){
XSLFTextShape shape = (XSLFTextShape)sh[j];
content += shape.getText() + "\n";
}
}
}
return content;
}