1

可能重复:
正则表达式匹配打开的标签,XHTML 自包含标签除外

我是正则表达式的新手,我想在使用正则表达式之间获取数据(地址)这是我的代码

<th align="left" valign="top">Billed To:</th>
<th align="left" valign="top">Shipped To:</th>
</tr>
<tr>
<td height="107" valign="top">
Logmet<br>
Wayne Rankin<br>
1400 Lake Bluff Cove <br>
Round Rock TX US 78665<br>
512-924-5437<br>
admin@logmet.com<br></td>
<td valign="top">
Logmet<br>
Wayne Rankin<br>
1400 Lake Bluff Cove <br>
Round Rock TX US 78665<br>
512-924-5437<br>
admin@logmet.com    </td>
</tr>

有谁知道我怎样才能得到这些标签之间的地址......提前谢谢

4

2 回答 2

0

我不知道正则表达式方法,但是在解析 html 时我使用这个http://simplehtmldom.sourceforge.net/

它又好又干净,对我来说效果很好。

于 2012-11-20T10:39:35.073 回答
0

正如一些人所说,正则表达式不是在这里使用的最佳工具......但如果你必须使用它:

$chars=array("\r\n", "\n", "\r");
$html=str_replace($chars, '', $html);
preg_match_all('/<td.*?>(.*?)<br>(.*?)<br>(.*?)<br>(.*?)<br>(.*?)<br>(.*?)<br><\/td>/', $html,$hits);
print_r($hits);

那一个可以让你得到每一个的一切td,基于br. 如果您只想获得其中一些,请删除()您不需要的那些

于 2012-11-20T11:09:46.553 回答