我的编码经验是在 Python 中。有没有一种简单的方法可以在 Firefox 中执行 python 代码来检测特定地址,比如 nytimes.com,加载页面,然后删除 html 后面的地址末尾(这允许绕过 20 次网页浏览/月的限制)并重新加载?
问问题
123 次
2 回答
1
您最好的选择是使用之前建议的硒。这是一个小例子,你可以如何做到这一点。基本上,代码会检查是否已达到限制,如果有,它会删除 cookie 并刷新页面,让您继续阅读。删除 cookie 可以让您在不连续编辑地址的情况下再阅读 10 篇文章。那是技术部分,您必须自己考虑法律影响。
from selenium import webdriver
browser=webdriver.Firefox()
browser.get('http://www.nytimes.com')
if browser.find_element_by_xpath('.//*[contains(.,"You’ve reached the limit of 10 free articles a month.")]'):
browser.delete_all_cookies()
browser.refresh()
于 2012-11-30T09:10:53.963 回答
0
你可以使用 selenium,它可以让你轻松地用 python 完全控制 firefox 和其他 web 浏览器。只需几行代码即可实现这一目标。这个答案如何集成 Selenium 和 Python有一个工作示例
于 2012-11-30T07:10:41.420 回答