我想使用 C# 和 RegEx 去除 HTML 字符串中的所有属性(及其值)。
例如:
<p>This is a text</p><span class="cls" style="background-color: yellow">This is another text</span>
会成为
<p>This is a text</p><span>This is another text</span>
此外,我需要删除所有属性,无论它们的值是否被引号包围。
IE
<p class="cls">Some content</p>
<p class='cls'>Some content</p>
<p class=cls>Some content</p>
都应该导致
<p>Some content</p>
由于安全原因,我不能使用 HTMLAgilityPack,所以我需要使用 RegEx 来执行此操作。