1

好吧,我开始有点沮丧了。我花了一天的大部分时间试图弄清楚为什么我的脚本不起作用 - 无论是在 github 上还是在此处。它应该相当简单。机械化加载页面,填写表格,提交表格,打开带有公司信息的新页面并发布内容。它只是不工作。当我检查代码时,我可以看到填写了正确的表单,但是在 mechanize 提交表单后,它并没有进入新页面,而是停留在填写表单的那个页面上。代码是这样的:

from mechanize import Browser

br = Browser()

url = "http://cvr.dk/Site/Forms/CMS/DisplayPage.aspx?pageid=0"

cvr = br.open(url).read()

#I select the form
br.select_form(name="aspnetForm")

#I fill in 19997049 as a company number
br.form['ctl00$QuickSearch1$CvrTextBox'] = "19997049"

response = br.submit()

content = response.read()

print content

我觉得这非常简单,但是当提交表单时,我错过了应该发生的重定向。

编辑: 网站上似乎有很多 javascripts。可能是这个原因吗?什么时候有什么选择?

EDIT2:好的,看来我可以简单地在网址中添加公司编号并以这种方式获取我想要的页面,但我仍然对为什么这个脚本不起作用感到困惑。

非常感谢您的任何反馈

4

1 回答 1

3

您需要告诉它使用哪个按钮:

response = br.submit(name='ctl00$QuickSearch1$CvrSearchButton')

这可行,但引发了 robots.txt 的问题,这是一个道德困境。

于 2012-12-29T00:58:36.813 回答