第一:我读过一般;不要在像这样的 XHTML 参数上使用 RegEx:RegEx 匹配除了 XHTML 自包含标签之外的开放标签,我确实理解 RegEx 在嵌套的 XHTML 或 XML 节点上将如何失败。
我不明白为什么单独操作 XML 的属性会破坏使用 RegEx。因此,一般规则似乎有例外。属性始终包含在以 a 开头并以 a<
结尾的单个>
节点< or >
中,这会破坏 XML,因此不会发生这种情况。
现在我想清理它可能包含的任何微数据的 XHTML 字符串。即任何属性itemscope
、itemtype
、itemprop
和。像这样的东西:itemid
itemref
...
<body itemscope="itemscope" itemtype="http://schema.org/WebPage">
<div itemprop="maincontent">content</div>
...
在 PHP 中执行此操作的最佳方法是什么?