0

我为每个站点的主题分配了 30 个请求。对于某些人来说,15-20 个请求都是徒劳的。我怎样才能减少这种情况?

我正在使用 Python BeautifulSoup 库从站点中提取数据。

The architecture of the site is as follows ( each topic ):
      www.abc.com/
      www.abc.com/1
      www.abc.com/2
      www.abc.com/3
      www.abc.com/4
      www.abc.com/5
      www.abc.com/6
for firstTemplate in firstTemplates:
      i=1
      while i < 30:
          sendRequest = requests.get(firstTemplate + str(i))
          source = BeautifulSoup(sendRequest.content, "lxml")
          i = i + 1

当我查看网站的所有问题时,平均/数量是 25-26。但并非所有线程都是相同的,我将 30 个请求分配为固定的。

例如:30 次请求后的www.abc.com/5 。我无缘无故地抛出 25 个请求。

我应该写类似“将相同的数据拉出循环”之类的东西吗?我认为这将提高程序的性能。但我不知道怎么做。

4

0 回答 0