我一直在尝试获取有关每个运行/段落的所有 docx 文档内容和信息。到目前为止,我已经设法从运行/段落属性中获取样式信息。
using (WordprocessingDocument doc = WordprocessingDocument.Open(filePath, false))
{
MainDocumentPart mainPart = doc.MainDocumentPart;
IEnumerable<Paragraph> paragraphs = mainPart.Document.Body.OfType<Paragraph>();
foreach (Paragraph paragraph in paragraphs)
{
string text = paragraph.InnerText;
IEnumerable<Run> runs = paragraph.Descendants<Run>();
foreach (Run run in runs)
{
string runText = run.InnerText;
RunProperties properties = run.RunProperties;
string fontsize = properties.FontSize.Val;
string fontsize2 = properties.FontSizeComplexScript.Val;
string fontaname = properties.RunFonts.HighAnsi;
}
}
}
但这只有在文本的格式(样式)不是默认值时才有效。换句话说,properties != null
里面的成员不是null
。到目前为止,我只看到一种方法 - 获取 style.xml 形成内容。在互联网上搜索没有给我任何线索。那么,如何访问 style.xml 或获取默认字体名称、字体大小等?