您不能盲目地将有效负载发送到某些网站并期望获得好的结果。首先,查看form
元素的源代码。我删除了一些不重要的部分:
<form action="/cgi-bin/findweather/getForecast" method="get" id="trip">
<input type="hidden" value="query" name="airportorwmo" />
<input type="hidden" value="DailyHistory" name="historytype" />
<input type="hidden" value="/history/index.html" name="backurl" />
<input type="text" value="" name="code" id="histSearch" />
<select class="month" name="month">
<option value="1">January</option>
<option value="2">February</option>
...
<option value="12">December</option>
</select>
<select class="day" name="day">
<option>1</option>
<option>2</option>
...
<option>31</option>
</select>
<select class="year" name="year">
<option>2018</option>
<option>2017</option>
...
<option>1945</option>
</select>
<input type="submit" value="Submit" class="button radius" />
</form>
首先,从元素的method
属性form
可以看出,您必须使用 GET 方法而不是 POST 来发送有效负载。其次,从action
属性中您还可以看到您应该将该有效负载发送到此特定 URL:
https://www.wunderground.com/cgi-bin/findweather/getForecast
有效负载本身不仅仅是您要发送的值。在许多情况下,必须发送其他值才能使 Web 服务器正确响应。通常最好发送所有内容(基本上是每个name
属性)或检查网站实际发送的内容。
这段代码对我有用:
import requests
URL = 'https://www.wunderground.com/cgi-bin/findweather/getForecast'
CODE = 'Los Angeles, CA'
DAY = 2
MONTH = 11
YEAR = 2017
params = {
'airportorwmo': 'query',
'historytype': 'DailyHistory',
'backurl': '/history/index.html',
'code': CODE,
'day': DAY,
'month': MONTH,
'year': YEAR,
}
r = requests.get(URL, params=params)
print(r.text)