我正在尝试将 html 样式的标记(例如粗体和斜体)转换为我自己的自定义标记格式:
<b>粗体字</b> ---> * 粗体字 *
所以粗体标签被转换为包装星等。
什么是最简单/最好/最快的方法?手动解析字符串很容易,但是正则表达式呢?
我正在使用 C# .NET 3.5 :)
如果您的 HTML 很复杂 - 嵌套标签、不匹配的标签等 - 我建议使用HTML Agility Pack来解析它。如果您想为此使用 RegEx,请务必关注 Jeff 的博客 -他们使用 RegEx 进行 StackOverflow 的 HTML 解析。
这应该这样做:
s = Regex.Replace(s, "<b>(.*?)</b>", "*$1*");
只要您在其他粗体标签中没有任何奇怪的粗体标签。