1

我正在研究 python 网络抓取

网页被 iframe 污染,内容由 ajax(jquery) 填充

我曾尝试使用 iframe 的 src(使用 lxml,。),但它没有用

如何使用 python 模块提取 iframe 的内容

谢谢

4

2 回答 2

1

Selenium 将为您完成这项工作。看看http://seleniumhq.org/docs/03_webdriver.html

于 2012-05-18T12:02:51.623 回答
1

Splinter(http://splinter.cobrateam.info - 使用 selenium)使浏览 iframe 元素变得容易。至少只要 iframe 标记具有 id 属性。

于 2012-05-19T08:23:54.750 回答