2

我对 GAE 中 mapreduce 支持的状态和文档感到非常困惑。

在官方文档https://developers.google.com/appengine/docs/python/dataprocessing/中,有一个示例,但是:

  • 应用程序使用 mapreduce.input_readers.BlobstoreZipInputReader,我想使用mapreduce.input_readers.DatastoreInputReader。文档中提到了 DatastoreInputReader 的参数,但没有提到发送回地图函数的返回值....
  • 应用程序“演示”(Helloworld 页)有一个mapreduce.yaml文件,该文件在应用程序中使用???

所以我找到了http://code.google.com/p/appengine-mapreduce/。这是一个带有 mapreduce.input_readers.DatastoreInputReader的完整示例,但它写道,reduce 阶段还不支持!

所以我想知道是否可以使用 DatastoreInputReader 实现 mapreduce 的第一种形式来执行真正的 map/reduce 以获得等效的 GROUP BY?

4

1 回答 1

2

第二个例子来自较早的版本,它确实只支持映射器阶段。但是,正如第一个示例所示,现在支持完整的 map/reduce 功能并且已经有一段时间了。mapreduce.yaml 来自那个早期版本,现在不用了。

我不确定你的实际问题是什么。毫不奇怪,从 DatastoreInputReader 发送到 map 函数的值是从被映射的种类中获取的单个实体。

于 2013-10-03T15:15:33.157 回答