我打算在 ~100GB 文件上使用 mincemeat.py 来完成我的 map reduce 任务。在看到 mincemeat 的示例代码后,我似乎需要输入一个内存字典作为数据源。那么,提供我的大文件作为肉馅数据源的正确方法是什么?
问问题
182 次
我打算在 ~100GB 文件上使用 mincemeat.py 来完成我的 map reduce 任务。在看到 mincemeat 的示例代码后,我似乎需要输入一个内存字典作为数据源。那么,提供我的大文件作为肉馅数据源的正确方法是什么?