1

我在 Rapidminer 中使用 xpath 时遇到问题。下面是我试图从中提取数据的示例 html。我在拨打 7001 和 Calfornia 时遇到问题。

我使用//h:span[@class='detail-block']//h:/text(),我可以得到“数字:”然后我试着//h:span[@class='detail-block']/span//h:/text()什么也得不到。我尝试了很多这种变化,但仍然一无所获。我能够让事情在谷歌电子表格 =importXML 上工作,但不能在 rapidminer 上工作。

<div class="information">
<h2 class="underline">Information</h2>
<span class="detail-block"><span class="detail-attribute">Number:&nbsp;</span>         
<span>7001</span></span>
<span class="detail-block"><span class="detail-attribute">Location:&nbsp;</span> <span>California</span></span>
4

1 回答 1

0

我不明白为什么你的“工作”示例(//h:span[@class='detail-block']//h:/text())应该这样做。是h:一个命名空间前缀。hand 后面必须跟一个节点或一个属性。

//h:span[@class='detail-block']//text()将任何依赖的文本节点返回到 span[@class='detail-block']:Number: 7001 Location: California

对于“数字:”,请使用:
//h:span[@class='detail-block'][1]/h:span[1]/text()

对于“7001 //h:span[@class='detail-block'][1]/h:span[2]//text()

对于“加利福尼亚”

//h:span[@class='detail-block'][2]/h:span[2]//text()

于 2013-06-20T07:54:14.577 回答