我遇到了 MS Word 文本格式问题,想知道是否有任何正则表达式极客也使用 MS Word(不太可能,我知道......)
我正在尝试使用 XML 标记包装一个在 Word 中以斜体显示的句子,例如
斜体文字
会成为
<i>Text in italics</i>
我可以为单个单词做,例如
<i>Text</i> <i>in</i> <i>italics</i>
但是我很难弄清楚如何找到一组斜体文本的开头和结尾,而不仅仅是单个单词。
到目前为止,我唯一的解决方案是将 MS Word 文档导出为 wML 并执行以下操作:
<w:r w:rsidRPr="00FE6181">
<w:t><hi></w:t>
</w:r>
<w:r w:rsidR="00D555A7" w:rsidRPr="00D77C71">
<w:rPr>
<w:i/>
</w:rPr>
<w:t xml:space="preserve">Text in italics</w:t>
</w:r>
<w:r w:rsidRPr="00FE6181">
<w:t><</w:t>
</w:r>
然后用word重新打开文档。作为非技术用户的解决方案推出只是有点涉及。
看起来这应该可以使用 RegExps(或者可能是 VBScript)我只是不知道如何到达那里。
任何帮助表示赞赏
谢谢