提交搜索表单后,我需要在网站上进行一些抓取。问题是当我通过浏览器执行此操作时,页面不会重新加载,也不会在任何地方重定向:结果显示在搜索表单下方,链接没有任何更改,尽管我可以在“新”页面中看到它们html。但是当我使用以下代码时,我看不到应该在响应中的“新”页面 html(提供的链接是我实际尝试使用的链接):
import mechanicalsoup
def fetchfile(query):
url = "http://www.italgiure.giustizia.it/sncass/"
browser = mechanicalsoup.Browser()
page = browser.get(url)
search_form = page.soup.find("form", {"id": "z-form"})
search_form.find("input", {"id":"searchterm"})["value"] = query
response = browser.submit(search_form, page.url)
print(response) # the response is 200, so it should be a good sign
# actual parsing will come later...
print("1235" in response.text) # quick-check to see if there is what I'm looking for, but I get False
# in fact this...
print(page.text == response.text) # ...gives me True
fetchfile("1235/2012")
我不明白我错过了什么。我宁愿不使用硒。有什么线索吗?