0

我使用 curl 获取 HTML 文件,并尝试使用 DOM 从中获取我需要的内容。

我已经尝试了一切(从我的角度来看),但它并没有像我想要的那样工作。

假设我有这个:

html = '<table cellpadding="0" cellspacing="0" id="uniq">
        <tr>
            <th>text</th>
            <td class="1_th">a1</td>
            <td class="1_td">b1</td>
        </tr>
        <tr>
            <th rowspan="3">text1</th>
            <td class="1_th">a2</td>
            <td class="1_td">b2</td>
        </tr>
        <tr>
            <td class="1_th">a3</td>
            <td class="1_td">b3</td>
        </tr>
        <tr>
            <td class="1_th">a4</td>
            <td class="1_td">b4</td>
        </tr>
        <tr>
            <th rowspan="2">text2</th>
            <td class="1_th">a5</td>
            <td class="1_td">b5</td>
        </tr>
        <tr>
            <td class="1_th">a6</td>
            <td class="1_td">b7</td>
        </tr>
    </table>'

我希望能够用 PHP 回应这一点:

text - a1 -b1
text1 - a2 -b2
text1 -a3 -b3
text1 -a4 -b4
text2 -a5 -b5
text2 -a6 -b6

该表很大,并且th具有 15 到 20 之间的可变行跨度。我想这样做echo是因为我想在 MySQL 中插入这些值。

我试过这个:

$dom = new DOMDocument();
@$dom->loadHTML($html);
$x = new DOMXPath($dom);
$table = $x->query('//*[@id="uniq"]')->item(0);
$rows = $table->getElementsByTagName("tr");
foreach ($rows as $row) {
    $tds = $row->nodeValue;
    echo $th;
}

没关系,我找到了我需要的解决方案,感谢您尝试帮助我

这是我做的,对我来说没问题:

$dom = new DOMDocument();
    @$dom->loadHTML($html);
    $x = new DOMXPath($dom); 


$table = $x->query("//*[@id='item_specification']/tr");
$rows = $table;
foreach ($rows as $row) {
 $atr_name = $row -> getElementsByTagName('td')->item(0)->nodeValue;
 $atr_val = $row -> getElementsByTagName('td')->item(1)->nodeValue;
 $cell1 = $row -> getElementsByTagName('th');
`$ifth = $cell1->length;
`if ($ifth == 1) {
$atr_cat = $row->getElementsByTagName('th')->item(0)->nodeValue;
}
  echo "{$atr_cat} - {$atr_name} - {$atr_val} <br \>";  
}
4

1 回答 1

0

尝试strip_tags()像这样使用:

<?php
$html = '<table cellpadding="0" cellspacing="0" id="uniq">
<tr>
<th>text</th>
<td class="1_th">a1</td>
<td class="1_td">b1</td>
</tr>
<tr>
<th rowspan="3">text1</th>
<td class="1_th">a2</td>
<td class="1_td">b2</td>
</tr>
<tr>
<td class="1_th">a3</td>
<td class="1_td">b3</td>
</tr>
<tr>
<td class="1_th">a4</td>
<td class="1_td">b4</td>
</tr>
<tr>
<th rowspan="2">text2</th>
<td class="1_th">a5</td>
<td class="1_td">b5</td>
</tr>
<tr>
<td class="1_th">a6</td>
<td class="1_td">b7</td>
</tr>
</table>';
$html = strip_tags($html);
echo $html;
?>

这是这个函数的一个 PHPFiddle

输出:

text a1 b1 text1 a2 b2 a3 b3 a4 b4 text2 a5 b5 a6 b7
于 2013-01-12T18:23:14.307 回答