.net - 用于匹配带有转义字符的 html 标签的正则表达式

Question

我正在使用正则表达式来帮助我过滤掉我不想翻译的本地化项目中的 HTML。通常我使用</?\w+((\s+\w+(\s*=\s*(?:".*?"|'.*?'|[^'">\s]+))?)+\s*|\s*)/?>但我正在翻译的内容在 HTML 中已转义字符，例如

<a href\="http\://www.fau.de/studium/zulassung/einschreibung/" target\="_blank"     title\="Externer Link auf die Webseite der FAU">

一些善良的灵魂可以帮助我解决如何匹配包含斜杠的html标签，它们不应该是真正的吗？

score 0 · Accepted Answer

我使用 ´/<(.|\n)*?>/g´ 来匹配我文本中的所有 HTML 标签，这对我忽略此内容很有用。

1 回答 1