我正在尝试使用 PHP 的 simplehtmldom 库从 html 文件中获取文本。我只想要<br>
标签之后的文本(TextAfterBreak),但只知道如何获取<font></font>
标签之间的整个文本(在这种情况下为 TextInsideFontTextAfterBreak)。我试过 find("/td/font/br")
但它返回一个空字符串可能是因为没有结束</br>
标签?任何帮助将不胜感激!
这是源 html 源文件片段:
<td>
<font size="-1" face="Verdana, Helvetica, Arial, sans-serif" color="#330000">
TextInsideFont
<br>
TextAfterBreak
</font>
</td>
这是我的代码片段:
$element=$row->find("/td/font");
echo $element =$element[0]->plaintext;
和输出:
TextInsideFontTextAfterBreak
注意:html 文件中的每个表行都是唯一的,因此任何正则表达式或字符串操作符都不起作用。