0

我正在尝试使用 PHP 的 simplehtmldom 库从 html 文件中获取文本。我只想要<br>标签之后的文本(TextAfterBreak),但只知道如何获取<font></font>标签之间的整个文本(在这种情况下为 TextInsideFontTextAfterBreak)。我试过 find("/td/font/br")但它返回一个空字符串可能是因为没有结束</br>标签?任何帮助将不胜感激!

这是源 html 源文件片段:

<td>
    <font size="-1" face="Verdana, Helvetica, Arial, sans-serif" color="#330000">
    TextInsideFont
    <br>
    TextAfterBreak
    </font>
</td>

这是我的代码片段:

$element=$row->find("/td/font");
echo $element =$element[0]->plaintext;

和输出:

TextInsideFontTextAfterBreak

注意:html 文件中的每个表行都是唯一的,因此任何正则表达式或字符串操作符都不起作用。

4

1 回答 1

3

explode()它在新行之后,因为plaintext剥离html数据:

$element = $row->find("/td/font");
$element = explode("\n", $element[0]->plaintext);
echo trim($element[1]);
于 2012-09-11T08:45:40.133 回答