8

我有许多将转换为 HTML 的 word 文档。要求将word文档中的段落转换为<p>元素。

在使用 Microsoft Office API 的 SaveAs 方法将文档转换为 HTML 进行一些测试后,我意识到带有手动换行符的段落(由“Shift-Enter”中断)不能放在单独的<p>元素中,而是将段落分组在同一个<p>元素中。

为了将它们分开,我一直在尝试在进行转换之前用“Enter”/回车替换“Shift-Enter”换行符。但是,我找不到合适的方法来进行换行符替换工作。我已经尝试过 SaveAs 方法中的 WdLineEndingType 参数,但它似乎对这个问题无效。

4

3 回答 3

15

对于那些在 MS Word 中查找的人:使用 Control-H {查找和替换]。

查找特殊字符:手动换行符(^l,小写 L)

替换为:段落标记 (^p)

Replace All 将完成整个文档。

编辑:更改为小写字符。

于 2015-02-01T22:56:21.770 回答
4

ms-word office API 在 Range 对象中提供了一个查找功能,可以搜索和替换字符串。

以下代码是用回车符(“^p”)查找手动换行符(“^l”)。

Range r = oDoc.Content;
r.WholeStory();
r.Find.Execute("^l", ref oMissing, ref oMissing, ref oMissing, ref oMissing, ref oMissing, ref oMissing, ref oMissing, ref oMissing, "^p", WdReplace.wdReplaceAll);

然后使用 SaveAs 将 word 文档转换为 HTML,它将正确地将每一行放置在<p>元素中。

于 2013-02-06T01:49:38.160 回答
0

段落标记(段落标记)

^p(在“使用通配符”选项打开时在“查找内容”框中不起作用),或 ^13

于 2018-06-22T04:57:43.633 回答