我正在使用正则表达式来帮助我过滤掉我不想翻译的本地化项目中的 HTML。通常我使用</?\w+((\s+\w+(\s*=\s*(?:".*?"|'.*?'|[^'">\s]+))?)+\s*|\s*)/?>
但我正在翻译的内容在 HTML 中已转义字符,例如
<a href\="http\://www.fau.de/studium/zulassung/einschreibung/" target\="_blank" title\="Externer Link auf die Webseite der FAU">
一些善良的灵魂可以帮助我解决如何匹配包含斜杠的html标签,它们不应该是真正的吗?