6

我试图找出 word 文档中是否存在字体为 2 的任何内容。但是,我无法做到这一点。首先,我尝试在只有一行和 7 个单词的示例 Word 文档中读取每个单词的字体。我没有得到正确的结果。

这是我的代码:

HWPFDocument doc = new HWPFDocument (fileStream);
WordExtractor we = new WordExtractor(doc);
Range range = doc.getRange()
String[] paragraphs = we.getParagraphText();
for (int i = 0; i < paragraphs.length; i++) {
  Paragraph pr = range.getParagraph(i);
  int k = 0
  while (true) {
     CharacterRun run = pr.getCharacterRun(k++);
     System.out.println("Color: " + run.getColor());
     System.out.println("Font: " + run.getFontName());
     System.out.println("Font Size: " + run.getFontSize());
     if (run.getEndOffSet() == pr.getEndOffSet())
       break;
  }
}

但是,上面的代码总是将字体大小加倍。即,如果文档中的实际字体大小为 12,则输出 24,如果实际字体为 8,则输出 16。

这是从word文档中读取字体大小的正确方法吗?

4

1 回答 1

2

是的,这是正确的方法;测量值是半点。

在 docx 中,你会有类似的东西:

<w:rPr>

  <w:sz w:val="28" /> 

</w:rPr>

@sz 上的 ECMA 376 规范将单位定义为ST_HpsMeasure(半点测量)

它与 HWPF 支持的二进制文档格式相同。如果您查看[MS-DOC],您会看到它还以半磅为单位指定了文本的大小。

于 2013-07-15T10:56:42.773 回答