2

我打算使用斜纹在一个页面上填写表单,点击提交按钮,然后使用 BeautifulSoup 解析生成的页面。如何为 BeautifulSoup 提供 HTML 页面?我假设我必须阅读当前的 url,但我不知道如何实际返回 url 才能这样做。我试过斜纹布的 TwillBrowser.get_url(),但它只返回 None。

4

2 回答 2

0

对于任何未来的患者,我发现使用机械化而不是斜纹布会更好,因为斜纹布是机械化的未更新薄壳。解决方法如下:

import mechanize

url = "foo.com"
br = mechanize.Browser()

br.open(url)

br.select_form(name = "YOURFORMNAMEHERE") #make sure to leave the quotation marks
br["YOURINPUTFIELDNAMEHERE"] = ["YOURVALUEHERE"] #this must be in a list even if it is only one value

response = br.submit()

print response.geturl()
于 2012-03-12T23:40:05.757 回答
0

终于想通了!

如果你像这样导入斜纹:

import twill.commands as com

然后网址 =

url = com.browser.get_url()

来源:http ://nullege.com/codes/search/twill.commands.browser.get_url?utm_expid=24446124-0.lSQi4Ea5S7WZwxHvFPbOIA.0&utm_referrer=https%3A%2F%2Fwww.google.com%2F

于 2014-03-14T15:48:20.920 回答