1

我有一个系统,它使用 Celery 跨计算集群运行 Python 任务来管理队列。这些任务对存储在 MapR-FS 中的数据进行操作(它公开了 Hadoop HFDS API,因此适用于 Hadoop HDFS 的技术应该适用于 MapR-FS)。

我希望能够确定存储在 MapR-FS 中的文件的位置,并分配任务在对文件具有本地访问权限的特定集群节点上运行。

这可能吗?

4

0 回答 0