php - 剥离
另一个标签内的标签

Question

我需要去掉pre 标签内的标签，我该如何在 php 中做到这一点？我的代码将是这样的：

<pre class="brush:php;">
<p>Guna</p><p>Sekar</p>
</pre>

我需要标签内的文本，只需要删除 标签。

score 1 · Accepted Answer

这可以用一个正则表达式来完成，这在 powershell 中进行了测试，但应该适用于大多数支持环视的正则表达式

$string = '<pre class="brush:php;"><p>Guna</p><p>Sekar</p></pre><pre class="brush:php;"><p>Point</p><p>Miner</p></pre>'
$String -replace '(?<=<pre.*?>[^>]*?)(?!</pre)(<p>|</p>)(?=.*?</pre)', ""

产量

<pre class="brush:php;">GunaSekar</pre><pre class="brush:php;">PointMiner</pre>

剖析正则表达式：

第一个前瞻验证在当前匹配之前有一个 pre 标签
第二个环视验证在 pre 标记和匹配项之间没有 /pre 标记
测试 p 和 /p
环顾四周以确保有一个结束 /pre 标记

score 0 · Accepted Answer

您可以使用基本的正则表达式。

<?php
$str = <<<STR
<pre class="brush:php;">
<p>Guna</p><p>Sekar</p>
</pre>
STR;
echo preg_replace("/<[ ]*p( [^>]*)?>|<\/[ ]*p[ ]*>/i", " ", $str);

score 0 · Accepted Answer

您可以使用preg_replace_callback()匹配<pre>标签中的所有内容，然后使用strip_tags()删除所有 html 标签：

$html = '<pre class="brush:php;">
<p>Guna</p><p>Sekar</p>
</pre>
';

$removed_tags = preg_replace_callback('#(<pre[^>]*>)(.+?)(</pre>)#is', function($m){
    return($m[1].strip_tags($m[2]).$m[3]);
}, $html);
var_dump($removed_tags);

请注意，这只适用于 PHP 5.3+

score 0 · Accepted Answer

你可以试试下面的代码。它运行 2 个正则表达式命令来列出 <pre> 标签内的所有 标签。

preg_match('/<pre .*?>(.*?)<\/pre>/s', $string, $matches1);
preg_match_all('/<p>.*?<\/p>/', $matches1[1], $ptags);

匹配的 标签将在 $ptags 数组中可用。

score 0 · Accepted Answer

这看起来很简单，但要花几个小时才能找到方法。这就是我所做的：

从源代码 forge 下载了简单的 dom 解析器
遍历每个<pre>标签并剥离标签
将内容重写为<pre>标签
检索修改的内容

这是完整的代码：

include_once 'simple_html_dom.php';
$text='<pre class="brush:php;"><p>Guna</p><p>Sekar</p></pre>';
$html = str_get_html($text);
$strip_chars=array('<p>','</p>');
foreach($html->find('pre') as $element){
  $code = $element->getAttribute('innertext');
  $code=str_replace($strip_chars,'',$code);
  $element->setAttribute('innertext',$code);
}
echo $html->root->innertext();

这将输出：

<pre class="brush:php;">GunaSekar</pre>

感谢您的所有建议。

php - 剥离另一个标签内的标签

5 回答 5

Related

Reference

php - 剥离
另一个标签内的标签