我有字符串:
<p justify;"="">Verslo centrai Lietuvos nekilnojamojo turto plėtros asociacijos konkurse ...</p>
并且想要删除标签
<p justify;"=""></p>
我的代码:
$content = strip_tags($text, '<p>');
但我得到空字符串:string(0) ""
,我做错了什么?
试着这样说
$content = strip_tags($text);
或者你可以用这样的正则表达式来做到这一点:
$content = preg_replace('/<[^>]*>/', '', $text);
通过这个$content = strip_tags($text, '<p>');
,您允许<p>
字符串中的标签。
有关更多信息,请参阅链接http://php.net/manual/en/function.strip-tags.php
由于 HTML 格式不正确,您可能需要编写自己的正则表达式来删除标签,或者在尝试删除标签之前清理 HTML。
您可以尝试这样做以删除“看起来像”标签的所有内容:
$str = preg_replace("/<.*?>/", " ", $str);
由于您的 HTML 格式不正确,您可以选择一种preg_replace()
方法:
$text = '<p justify;"="">Verslo centrai Lietuvos nekilnojamojo turto plėtros asociacijos konkurse ... </p>';
$content = preg_replace('/<[^>]*>/', '', $text);
var_dump($content);
// string(108) "Verslo centrai Lietuvos nekilnojamojo turto plėtros asociacijos konkurse ... "
在strip_tags() 文档上它说:因为 strip_tags() 实际上并不验证 HTML,部分或损坏的标签可能导致删除比预期更多的文本/数据。
第二个参数也是 for $allowable_tags
。
这将删除所有内容 - 标签、ascii、换行符,但纯文本:
strip_tags(preg_replace('/<[^>]*>/','',str_replace(array(" ","\n","\r"),"",html_entity_decode($YOUR_STRING,ENT_QUOTES,'UTF-8'))));
这将替换所有 html 标签, https://regex101.com/r/jM9oS4/4
preg_replace('/<(|\/)(?!\?).*?(|\/)>/',$replacement,$string);
从 PHP 7.4.0 开始,strip_tags() 可以选择接受带有允许标签的数组,
那么这个:
<?php
$html = '<div id="my-div"><p>text<strong><a href="#link"></a></strong></p></div>';
echo strip_tags($html, ['p', 'a']); //accept p and a tags
返回这个:
<p>text<a href="#link"></a></p>
请注意,仅删除了不允许的标签。