我目前正在做一个项目,我需要使用 XPath 提取一些地址。下面的 XPath 返回一个节点中需要的所有文本,因为使用normalize-space. 如果我删除normalize-space,则在 3 个不同的节点中返回所需的文本,将地址、城市和邮政编码以及国家/地区分开。使用normalize-space将所有 3 个节点合并为一个节点,但会弄乱地址的空白,如下所示。
XPath
normalize-space(//table/tr/td[@class='shaded']/table[@cellspacing='10']/tr[2]/td[2])
退货
22-13 20 St., 3nd Fl., FrontStaten Island City, New York 12101United States
期望的输出
22-13 20 St., 3nd Fl., Front, Staten Island City, New York 12101, United States
HTML
<td>
   <span class="dispaly">
      Address:
   </span> 
</td>
<td>
   22-13 20 St., 3nd Fl., Front
   <br>
   Staten Island City, New York 12101
   <br>
   United States
</td>
我很欣赏有关如何达到所需输出的任何建议。
提前谢谢了!