-1

我有一个很大的 html 内容条目。我只需要将纯文本拆分为数组中的单独条目,以便我可以通过翻译工具运行它,然后将其替换为原始 html。

我设法将其清理干净,然后将行拆分为一个数组,但文本...to do this <a href="#" title="blah">click here</a>返回为...to do this click here.

由于标签,对该文本执行 astr_replace将不再匹配。a

因此,我需要一种方法将通常会被剥离的标签strip_tags转换为插入的值,我可以用它来分解字符串。

有什么建议么?

4

1 回答 1

0

好的,我已经弄清楚了,在这种情况下,DOM 比我需要的要复杂得多。

更简单的解决方案是使用正则表达式匹配来查找所有标签,然后将 html 分解为这些标签。

preg_split('/<.+?>/', $html);

这仅留下文本。由于我不需要任何标签信息,因此处理起来也应该更快。

于 2013-03-31T03:19:43.243 回答