什么是最容易使用的分布式 map reduce 编程系统?
例如。在包含许多用户的分布式数据存储中,每个用户都有许多连接,假设我想计算连接总数:
Map:
for all records of type "user"
do for each user
count number of connections
retrun connection_count_for_one_user
Reduce:
reduce (connection_count_for_one_user)
total_connections += connection_count_for_one_user
是否有任何 mapreduce 系统可以让我以这种方式编程?