1

我有以下代码来解析 html 表。如何检查<td>元素中的指定文本?这不起作用:val=doc.xpath('//tr/td[child::*[text()="Street :"]/span/text()')。我试图<span>仅在<td>文本匹配“街道:”时提取文本。非常感谢任何反馈!

import lxml.html as lh

html='''<tr>
<td>
Street : <span> High St. </span>
</td>
</tr>
<tr>
<td>
City : <span> Hightstown </span>
</td>
</tr>'''

doc=lh.fromstring(html)

#val=doc.xpath('//tr/td[child::*[text()="Street :"]/span/text()')
#street=doc.xpath('//tr/td/text()')
val=doc.xpath('//tr/td/span/text()')

#print street
print val
4

1 回答 1

2
>>> doc.xpath('//tr/td[contains(text(),"Street :")]/span/text()')
[' High St. ']
于 2012-05-18T19:19:43.623 回答