有没有比我更了解正则表达式的人知道如何拆分 html 代码,以便将所有标签和所有单词分开,即。
<p>Some content <a href="www.test.com">A link</a></p>
是这样分开的:
array = { [0]=>"<p>",
[1]=>"Some",
[2]=>"content",
[3]=>"<a href='www.test.com'>,
[4]=>"A",
[5]=>"Link",
[6]=>"</a>",
[7]=>"</p>"
到目前为止,我一直在使用 preg_split 并且成功地设法按空格拆分字符串或按标签拆分 - 但是当我需要将其拆分为时,所有内容都在一个数组元素中。
有人帮我吗?