0

我正在从 <iframe> 中获取数据。然后我想使用 <iframe> 获取数据lxml

我没有找到任何可以从中获取 <iframe> 的资源lxml

谁能帮助我让我知道如何实现它?

4

2 回答 2

5

您可以从中提取src属性iframe,然后从 url 获取数据urllib,最后使用lxml.

示例代码(未测试):

from lxml.etree import fromstring
data = urllib.urlopen(url) # fetching url with iframe
tree = fromstring(data.read()) # parsing tree to get src attribute
src_url = tree.cssselect("iframe").attrib['src']
data = urllib.urlopen(src_url) # open iframe src url
tree = fromstring(data.read()) # parsing iframe tree
于 2012-04-16T12:54:20.400 回答
1

我们src从 中找到属性,然后通过请求库iframe从 url 获取数据。src

import lxml.html as lh
import requests


rq= requests.get(url)

content = rq.content

doc = lh.fromstring(content)

for i, elt in enumerate(doc.xpath('//[@id="page_content"]/div[2]/div/div/iframe')):

     url_data = elt.attrib.get('src')
     data = requests.get(url_data).content)
于 2016-08-24T06:48:27.217 回答