新手程序员和潜伏者,希望得到一些明智的建议。:)
结合使用 Python、BeautifulSoup 和 Bing API,我能够通过以下代码找到我想要的内容:
import urllib2
from BeautifulSoup import BeautifulStoneSoup
Appid = #My Appid
query = #My query
soup = BeautifulStoneSoup(urllib2.urlopen("http://api.search.live.net/xml.aspx?Appid=" + Appid + "&query=" + query + "&sources=web"))
totalResults = soup.find('web:total').text
所以我想在几千个搜索词中这样做,我想知道是否
- 执行此请求一千次将被解释为锤击服务器,
- 我应该采取哪些步骤来不锤击所述服务器(最佳实践是什么?),以及
- 是否有使用任何主要搜索引擎 API 的更便宜的(数据)方式来做到这一点?
获取所有数据只是为了获取每个关键字的一个数字似乎不必要地昂贵,我想知道我是否错过了任何东西。
FWIW,我做了一些功课,并在使用 Bing API 之前尝试了 Google Search API(已弃用)和 Yahoo 的 BOSS API(很快将被弃用并替换为付费服务)。我知道直接抓取页面被认为是糟糕的形式,所以我将直接抓取搜索引擎。