我需要对看起来像这样的字符串进行一些清理:
$author_name = '<a href="http://en.wikipedia.org/wiki/Robert_Jones_Burdette>Robert Jones Burdette </a>';
请注意,href 标记没有右引号——我在其中的一个大表上使用 DOMParser 来提取文本,这很糟糕。
我想看看 $author_name 中的字符串;
如果第一个 > 前面没有 ",则将其替换为 "> 以正确关闭标签。如果没问题,请跳过并执行下一步。确保根本不替换第二个 >。
使用 php 正则表达式,我无法找到一个可行的解决方案 - 我可以将整个事情切碎并检查它的部分,但这会很慢,我认为必须有一个正则表达式可以做我想要的。
TIA