我目前正在做一个项目,我需要使用 XPath 提取一些地址。下面的 XPath 返回一个节点中需要的所有文本,因为使用normalize-space
. 如果我删除normalize-space
,则在 3 个不同的节点中返回所需的文本,将地址、城市和邮政编码以及国家/地区分开。使用normalize-space
将所有 3 个节点合并为一个节点,但会弄乱地址的空白,如下所示。
XPath
normalize-space(//table/tr/td[@class='shaded']/table[@cellspacing='10']/tr[2]/td[2])
退货
22-13 20 St., 3nd Fl., FrontStaten Island City, New York 12101United States
期望的输出
22-13 20 St., 3nd Fl., Front, Staten Island City, New York 12101, United States
HTML
<td>
<span class="dispaly">
Address:
</span>
</td>
<td>
22-13 20 St., 3nd Fl., Front
<br>
Staten Island City, New York 12101
<br>
United States
</td>
我很欣赏有关如何达到所需输出的任何建议。
提前谢谢了!