0

所以我正在使用PHP 简单 HTML DOM 解析器,我试图从这个网页获取顶级进球者的表格列表: http://www.transfermarkt.co.uk/en/chinese-super-league/startseite/wettbewerb_CSL。 html(这是前 5 名...)

我正在尝试解析表Top Goal Scorers并且其 ID 为"spieler"。在这样做时,我想获取每个表格行并自己列出它们。问题是……在名称/俱乐部下方……有一个新<table>功能可以使图像、名称和俱乐部名称更容易在网页上显示。

我正在尝试找出 DOM,以便我可以看到需要选择的内容并获得正确的球员姓名、俱乐部名称和目标。谢谢。

这是我到目前为止所拥有的:

<textarea id='txt_out'>
<?php
echo "Player | Team | Goals\n:--|:--|:--:\n";

$url = "http://www.transfermarkt.co.uk/en/chinese-super-league/startseite/wettbewerb_CSL.html";
$html = file_get_html($url);

foreach($html->find('#spieler') as $row) {

  if ($i > 0) {
   $player = $row->find('table tr',3)->plaintext;
        echo $player . "|TEST TEAM|0";
    }
   $i++;
}
?>
</textarea>

echo将返回空白。

<textarea id="txt_out">Player | Team | Goals
:--|:--|:--:
</textarea>
4

2 回答 2

2

好了(你必须稍微调整一下属性才能得到你想要的输出):在这个解决方案中,我只取所有的 tds 并在我检查它们不包含内表后获取它们的明文。

$output = '<table border="1">
                <tr>
                    <td>#</td>
                    <td>Player</td>
                    <td>Team</td>
                    <td>goals-1</td>
                    <td>goals-2</td>
                    <td>goals-3</td>
                    <td>points</td>
                </tr>
            ';

$url = "http://www.transfermarkt.co.uk/en/chinese-super-league/startseite/wettbewerb_CSL.html";
$html = file_get_html($url);

$tbl = $html->find('#spieler',0);

$trs = $tbl->find('tr[class=dunkel],tr[class=hell]');

foreach($trs as $tr){
    $output .= '<tr>';
    $tds = $tr->find('td');
    foreach($tds as $td){
        $inner_table = $td->find('table',0);
        if(!$inner_table){  
            $text = trim($td->plaintext);
            if($text != ''){
                $output .= '<td>' . $td->plaintext . '</td>';
            }
        }  
    }
    $output .= '</tr>';
}

$output .= '</table>';

echo($output);
于 2013-05-05T11:34:58.940 回答
0

使用 DOMNodelist->item() (item() 期望索引作为参数,它是从零开始的,所以 1 将返回第二个表)

 $table = $dom->getElementsByTagName('table')->item(1);
于 2013-05-05T10:53:02.130 回答