我打算使用斜纹在一个页面上填写表单,点击提交按钮,然后使用 BeautifulSoup 解析生成的页面。如何为 BeautifulSoup 提供 HTML 页面?我假设我必须阅读当前的 url,但我不知道如何实际返回 url 才能这样做。我试过斜纹布的 TwillBrowser.get_url(),但它只返回 None。
1049 次
2 回答
0
对于任何未来的患者,我发现使用机械化而不是斜纹布会更好,因为斜纹布是机械化的未更新薄壳。解决方法如下:
import mechanize
url = "foo.com"
br = mechanize.Browser()
br.open(url)
br.select_form(name = "YOURFORMNAMEHERE") #make sure to leave the quotation marks
br["YOURINPUTFIELDNAMEHERE"] = ["YOURVALUEHERE"] #this must be in a list even if it is only one value
response = br.submit()
print response.geturl()
于 2012-03-12T23:40:05.757 回答
0
终于想通了!
如果你像这样导入斜纹:
import twill.commands as com
然后网址 =
url = com.browser.get_url()
于 2014-03-14T15:48:20.920 回答