有一个 html 页面,它包含一个块:
<table class="tborder" cellpadding="6" cellspacing="1" border="0" width="100%" align="center">
<tr>
<td class="tcat" colspan="2">
Some regular text <span class="normal">the desired text 1</span>
</td>
</tr>
<tr>
<td class="alt1" colspan="2">
<span class="smallfont"><a href="page.php?u=00001">link1</a>, <a href="page.php?u=00002"><i><b><font color="#006400">link2</font></b></i></a></span>
</td>
</tr>
</table>
帮助我使用简单的 html dom 库或正则表达式进行解析,因此只能在此处推断:
the desired text 1 <span class="smallfont"><a href="page.php?u=00001">link1</a>, <a href="page.php?u=00002"><i><b><font color="#006400">link2</font></b></i></a></span>
如果我这样做:
<?
include 'simple_html_dom.php';
$html = file_get_html('http://some-url.com/power.html');
foreach($html->find('td[class="tcat"]') as $element1)
echo $element1. '<br>';
foreach($html->find('span[class="smallfont"]') as $element2)
echo $element2. '<br>';
?>
因此,除了必要的数据外,还会显示页面上呈现的更多相似元素。(使用相同的参数 'td class="tcat"' 和 'class="smallfont"')我只需要这样推断:
the desired text 1 <span class="smallfont"><a href="page.php?u=00001">link1</a>, <a href="page.php?u=00002"><i><b><font color="#006400">link2</font></b></i></a></span>