在准备执行以下操作时,我发现了很多不清楚的信息,所以我想我问一下是否有人可以为我解决问题。
@ 符号对以下内容究竟做了什么
$domOb = new DOMDocument();
$html = @$domOb->loadHTMLFile('http:...');
这确实消除了一个错误并实际解析了数据,但这是一个很好的实践解决方案。我在没有@符号的情况下使用了它并得到了预期的结果。
鉴于我有几个表,<td>
从表 3 中获取所有数据的最佳/最简单方法是什么。我将列出所有<td>
数据,然后简单地以与所需数据相关的值开始和结束
如果希望通过 PHP 解析 HTML,我喜欢使用 DOM 的想法,所以在获取文件时应该使用什么。 loadHTMLFile()
loadHTML()
...我还可以使用 Xpath 吗?...如果它的 HTML 非常繁忙/标记错误,这有关系吗?
什么是查看数据的好习惯
$items = $domOb->getElementsByTagName('td');
$k = 0;
$num = $items->length;
while ($k < $num)
{
echo $item_web = $items->item($k)->, '<br>';
$k++;
}
我发现这很好你如何在 PHP 中解析和处理 HTML/XML?但它已经 2 岁了,所以我想我会提出一些问题。
只是第 3 个表格的一个小片段...乍一看,我注意到第 3 个标签有一个空格,这会影响结果吗?
<td>Parcel ID: <a href=... style=text-decoration:underline;><b>666666</b></a></td>
<td>Name: Mr. help</td></tr><tr>
<td >Parcel Address: 666 help RD </td>
<td>Name2: Ms. help F</td></tr><tr><td>City: Helpover 66666</td>
<td>Address: 6666 6TH AVE NE UNIT 333</td>