0

我正在尝试将 html 样式的标记(例如粗体和斜体)转换为我自己的自定义标记格式:

<b>粗体字</b> ---> * 粗体字 *

所以粗体标签被转换为包装星等。

什么是最简单/最好/最快的方法?手动解析字符串很容易,但是正则表达式呢?

我正在使用 C# .NET 3.5 :)

4

2 回答 2

2

如果您的 HTML 很复杂 - 嵌套标签、不匹配的标签等 - 我建议使用HTML Agility Pack来解析它。如果您想为此使用 RegEx,请务必关注 Jeff 的博客 -他们使用 RegEx 进行 StackOverflow 的 HTML 解析

于 2009-08-03T06:53:27.503 回答
0

这应该这样做:

s = Regex.Replace(s, "<b>(.*?)</b>", "*$1*");

只要您在其他粗体标签中没有任何奇怪的粗体标签。

于 2009-08-03T06:51:52.780 回答