0

我正在尝试从此页面上的特定元素中抓取文本数据(使用 scraperwiki)

import requests
from lxml import html

response = requests.get(http://portlandmaps.com/detail.cfm?action=Assessor&propertyid=R246274)

tree = html.fromstring(response.content)
owner = tree.xpath('/html/body/div[2]/table[1]/tbody/tr[11]/td[2]')

print owner.text

scraperwiki 控制台返回:

AttributeError: 'list' object has no attribute 'text'

我使用 Google Chrome 查找 XPath,但我假设 requests 使用与 chrome 相同的标准

4

1 回答 1

0

那是因为你要找的东西都不存在。先试试家长。

然后,一旦可行,试试这个:

owner[0].text

如果您找不到/记住您想要的 tr,只需获取第三个索引的所有 td:

tree = html.fromstring(response.content)
owner = tree.xpath('/html/body/div[2]/table[1]/tbody/tr/td[2]')

texts = [o.text for o in owner]
print texts

然后,选择并相应地修改代码。希望这可以帮助。

于 2013-07-24T19:24:25.130 回答