是否可以运行 Hadoop 使其仅使用空闲的 CPU 周期?即,在人们的工作机器上安装 Hadoop 是否可行,以便在他们不使用 PC 时可以进行数字运算,并且他们不会经历明显的性能消耗(把粉丝抛在一边!)。
也许这只是将 JVM 设置为以低优先级运行而不使用“太多”网络的情况(假设这样的事情在 Windows 机器上是可能的)?
如果没有,是否有人知道BOINC之类的 Java 等价物?
编辑:在此处找到循环清除基础设施列表。尽管我关于 Hadoop 的问题仍然存在。
这远远超出了 Hadoop 的预期用途。Hadoop 期望它的所有节点都完全可用并联网以实现最佳吞吐量——而不是您通过工作站获得的东西。此外,它甚至没有真正在 Windows 中运行(您可以将它与 cygwin 一起使用,但我不知道有人将它用于“生产”——除了作为发布作业的客户端机器)。
Hadoop 会在一些节点上存储数据块,并尝试将所有计算安排在这些节点上的数据上;在工作共享环境中,这意味着需要这些数据的任务将希望在这三个工作站上运行——不管他们的用户目前在做什么。相比之下,“周期清理”项目将所有数据保存在其他地方,并将其和任务发送到给定时刻可用的任何节点;这使它们对机器更好,但它会产生明显的数据传输成本。
也许兵马俑更适合您?