我的目标是读取 .docx 文件并在视图(网页)上显示该文件的文本。
我正在使用 apache POI 在 Grails 应用程序中读取 .docx 文件 请建议我一种在视图上显示输出而不会丢失空格和换行符的方法。
我的 .docx 文档内容
This is a .docx document ...
this is second line
this is third line
在我打印时阅读后在 Groovy 控制台上的结果:
This is a .docx document ...
this is second line
this is third line
但是当我将输出传递给查看时它变成了
This is a .docx document ... this is second line this is third line
.
My code is :
import org.apache.poi.xwpf.usermodel.XWPFDocument
import org.apache.poi.xwpf.extractor.XWPFWordExtractor
...
String str = "E:\\Query.docx"
File docFile = null;
docFile = new File(str);
FileInputStream fis=new FileInputStream(docFile.getAbsolutePath());
XWPFDocument doc = new XWPFDocument(fis)
XWPFWordExtractor docExtractor = new XWPFWordExtractor(doc)
println docExtractor.getText()
...
如果有人可以建议我遍历文档每一行的方法,那么我可以很容易地得到我的结果。请帮助我,我被卡住了。