2

假设我有这个来自源的 HTML(报废它):

<tr class="calendar_row" data-eventid="41675">
    <td class="alt2 eventDate smallfont" align="center"/>
    <td class="alt2 smallfont" align="center">9:00pm</td>
    <td class="alt2 smallfont" align="center">AUD</td>
    <td class="alt2 icon smallfont" align="center">
         <div class="cal_imp_medium" title="Medium Impact Expected"/>
    </td>
    <td class="alt2 eventHigh smallfont" align="center">
         <div class="calendar_detail level_1" data-level="1" title="Open Detail"/>
    </td>

    //I want to get this part below correctly

    <td class="alt2 pad_left eventHigh smallfont" align="center">0.2%</td>
    <td class="alt2 pad_left eventHigh smallfont" align="center"/>
    <td class="alt2 pad_left eventHigh smallfont" align="center">
        <span class="revised worse" title="Revised From -0.3%">-0.4%</span>
    </td>
</tr>​

我想通过 XPath 获取 td 的值(nodeValues):

$query = $xpath->query('//tr[@data-eventid="41675"]/td[@class="alt2 pad_left eventHigh smallfont"]');

我不明白为什么我只得到-0.4%的值。尽管 html 似乎很复杂,并且与它的格式化方式无关,但是否有任何可能的方法(查询)来检索标签之间的值,包括第二个 td 上的空值?

完整代码

libxml_use_internal_errors(true);
$doc    = new DOMDocument();
$doc->loadHTML($html);
$xpath  = new DOMXPath($doc);

$query_results = $xpath->query('//tr[@data-eventid="'.$data_eventid.'"]/td[@class="alt2 pad_left eventHigh smallfont"]');
foreach($query_results as $values){
    if($values->nodeValue!=' ' and $values->nodeValue!='' and $values->nodeName!='#text') { //Discards Empty Arrays
        $table_values[$data_eventid][5] = $values->nodeValue;
    }
}
4

2 回答 2

1

试试这个://tr[@data-eventid="41675"]/td[@class="alt2 pad_left eventHigh smallfont"]/descendant-or-self::*/text()

好吧,您可能只想要节点,所以请/text()关闭:

//tr[@data-eventid="41675"]/td[@class="alt2 pad_left eventHigh smallfont"]/descendant-or-self::*
于 2012-12-20T15:36:58.340 回答
1

您的 XPath 匹配三个td元素,第一个 contains 0.2%,然后是一个空元素,最后一个 contains <span class="revised worse" title="Revised From -0.3%">-0.4%</span>

您按顺序将这些节点的值(跳过空节点)分配给同一个变量table_values[$data_eventid][5]- 因此将包含最后一个(非空)节点的值 - 即-0.4%

如果您想要所有节点的值,您应该将它们附加到列表中,或者将它们放置在数组的不同元素中。

于 2012-12-21T19:19:48.070 回答