-3

所以,我想知道如何让这个问题在 Google App Engine mapreduce 框架上运行,或者实际上是否可以让它运行。所以我有一个输入文件,它被分成多个部分并存储在谷歌云中。现在我想在所有拆分的部分上运行相同的 Python 代码,然后将其按顺序组合回一个输出文件。如果我在输入文件上运行我的代码而不将其拆分,则大约需要 20 分钟。

我基本上不了解 map-shuffle-reduce 模型。如果有人可以向我解释,那就太好了。谢谢!

4

1 回答 1

3

有一个很好的演讲Google I_O 2012Google Compute Engine 简介,您可以在 YouTube 上轻松找到它,它解释了所有细节以及如何设置以及如何获得结果。

于 2012-11-24T14:37:53.573 回答