假设我在单独的 excel 文件中有大量独立的数据集。
在运行时效率方面,使用clojure Pmap函数处理数据或hadoop map reduce会更好吗?
每个 excel 文件至少包含大约 34000 行,我有很多。
对不起初学者的问题,因为我对两者都比较陌生并且正在研究它们
正如你们中的一些人所解释的,
也许还有一个问题是将 clojure pmap 与运行相同软件副本的多个实例的实例进行比较,它们之间有什么区别?
我唯一能想到的是 pmap 可以接受任意数量的变量,但是,每个应用程序实例读取一个文件需要预先知道文件的数量并初始化实例