考虑到大多数语言都具有内置或由其他语言制作的网页抓取功能,这更像是一个一般的网页抓取问题。
我有一个网站,我想从大约 6 个不同的页面中提取信息。这通常不会那么糟糕。不幸的是,这些页面上的信息大约每十秒更改一次,这可能意味着每小时有超过 2000 个查询(这根本不行)。我想到的网站也没有 api。是否有任何可能的有效方法来获取我需要的信息量而不会用请求淹没它们,还是我不走运?
考虑到大多数语言都具有内置或由其他语言制作的网页抓取功能,这更像是一个一般的网页抓取问题。
我有一个网站,我想从大约 6 个不同的页面中提取信息。这通常不会那么糟糕。不幸的是,这些页面上的信息大约每十秒更改一次,这可能意味着每小时有超过 2000 个查询(这根本不行)。我想到的网站也没有 api。是否有任何可能的有效方法来获取我需要的信息量而不会用请求淹没它们,还是我不走运?