0

我需要同时废弃大约 40 个随机网页。这些页面因每个请求而异。我在 python 中使用 rpcs 来获取 url 并使用 BeautifulSoup 抓取数据。报废所有数据并显示在屏幕上大约需要 25 秒。

为了提高速度,我将数据存储在 appengine 数据存储中,这样每个数据只被抓取一次,并且可以从那里快速访问。

但是问题是->随着数据存储中数据大小的增加,从数据存储中获取数据需要很长时间(比抓取更多)。

我应该使用 memcache 还是转移到 mysql?mysql 比 gae-datastore 快吗?或者有没有其他更好的方法来尽快获取数据?

4

1 回答 1

0

根据我对您的应用程序的了解,使用 memcache 是有意义的。它会更快,并且会自动处理诸如过期缓存条目之类的事情。

于 2013-04-21T12:21:03.483 回答