我正在寻找一个很好的参考
使用 Clojure 进行大规模数据挖掘
我知道许多优秀的 clojure 编程书籍(Programming Clojure、Joy of Clojure……),以及许多优秀的数据挖掘教科书(挖掘海量数据集、管理千兆字节……)。但是我不知道有任何专门针对
使用 Clojure 进行大规模数据挖掘
“with clojure”部分对我来说相当重要,原因如下:
* most theoretical analysis uses big-Oh running time, which ignores constants
* constants matter, if it ends up being a matter of 1 second vs 1 hour (for things that need to be real time)
* or 1 hour vs 1 week (for batch jobs)
特别是,我认为 JVM、Clojure 数据结构之间存在很多相互作用,无论数据是存储在内存中还是从磁盘中懒惰地读取——它们可以通过“稍微”不同的实现来让“相同”的算法具有截然不同的运行时间.
因此,我的问题(以上所有内容都是为了避免被“Check Google”关闭):
用 Clojure 进行海量数据挖掘的好资源是什么?
谢谢!