我正在尝试使用 Map-Reduce 框架开发一个大型程序,该程序需要将整个过程拆分为三个应按顺序发生的 Map-Reduce 作业。
我使用mincemeat.py是因为我在很多地方读到它比 octo.py 和 python 中的其他框架实现更快。
但我无法链接多个作业,因为每个客户端都需要提供密码并连接到服务器以执行。我的想法是,通过启动客户端,所有作业都应该按顺序运行。我是python的新手。感谢是否有人可以在这方面帮助我。
下面是启动作业的代码,例如 wordCount here..
s = mincemeat.Server()
s.datasource = datasource
s.mapfn = map_wordCount
s.reducefn = reduce_wordCount
wordCounts = s.run_server(password="password")
print wordCounts
我希望调用另一个作业的 map 和 reduce 函数,而不需要单独的客户端调用它。任何人都可以指出如何做到这一点。
谢谢。