我在数据库中有几亿行作为输入数据。每 10000 行处理大约需要 15 分钟,因为涉及到外部 API 请求。
我将把它划分为数据点并使用数百个 Amazon AWS EC2 实例进行处理。在 EC2 实例上启动的每个进程也会将输出保存在数据库中。
是否可以使用云服务将这个多代理任务组织为 map reduce claster?
我在数据库中有几亿行作为输入数据。每 10000 行处理大约需要 15 分钟,因为涉及到外部 API 请求。
我将把它划分为数据点并使用数百个 Amazon AWS EC2 实例进行处理。在 EC2 实例上启动的每个进程也会将输出保存在数据库中。
是否可以使用云服务将这个多代理任务组织为 map reduce claster?