0

这是我第一次使用 mechanize,我正在尝试使用 mechanize 填写表格

这是我的浏览器选项:

br.set_handle_equiv(True)
br.set_handle_gzip(True)
br.set_handle_redirect(True)
br.set_handle_referer(True)
br.set_handle_robots(False)


cj = cookielib.LWPCookieJar()
br.set_cookiejar(cj)


br.addheaders = br.addheaders = [('User-agent', 'Mozilla/5.0 (X11; U; Linux i686; en-    US; rv:1.9.0.1) Gecko/2008071615 Fedora/3.0.1-1.fc9 Firefox/3.0.1')]

我用有效值填写表单并点击 br.submit() 但它给了我 HTTP:错误 500:内部服务器错误。我假设它检测到它是一个机器人或提交的东西?但我认为这就是 addheaders 应该处理的问题。

4

1 回答 1

1

你可以使用http://grablib.org/docs/,它更容易更高效。试试看。在linux上安装:

点安装 pycurl lxml

点安装抓取

from grab import Grab

g = Grab()
g.go('http://google.com') # go to google.com
g.choose_form(0)  #form number
g.set_input('q', 'test')  # 'q'-input name, 'test' - search query
g.submit()  # send request
print g.xpath_list('//a/text()') # view xpath result link list 

对不起我的英语不好。

于 2013-03-14T23:42:16.043 回答