3

我的目标是读取 .docx 文件并在视图(网页)上显示该文件的文本。

我正在使用 apache POI 在 Grails 应用程序中读取 .docx 文件 请建议我一种在视图上显示输出而不会丢失空格和换行符的方法。

我的 .docx 文档内容

This is a .docx document ...
this is second line
this is third line

在我打印时阅读后在 Groovy 控制台上的结果:

This is a .docx document ...
this is second line
this is third line

但是当我将输出传递给查看时它变成了

This is a .docx document ... this is second line this is third line

.

My code is : 

    import org.apache.poi.xwpf.usermodel.XWPFDocument
    import org.apache.poi.xwpf.extractor.XWPFWordExtractor

    ...
            String str = "E:\\Query.docx"
            File docFile = null;
            docFile = new File(str);
            FileInputStream fis=new FileInputStream(docFile.getAbsolutePath());
            XWPFDocument doc = new XWPFDocument(fis)
            XWPFWordExtractor docExtractor =  new XWPFWordExtractor(doc)
            println docExtractor.getText()
    ...

如果有人可以建议我遍历文档每一行的方法,那么我可以很容易地得到我的结果。请帮助我,我被卡住了。

4

1 回答 1

1

HTML 忽略换行符。因此,虽然像 "Hello there\nLine 2\n" 这样的字符串在控制台中呈现为

Hello There
Line 2

作为 HTML,它将全部显示在同一行。您需要用一些合适的 HTML 替换换行符,例如,<br />或者将内容包装在段落/div 标记中。

于 2012-10-08T11:40:15.030 回答