10

我正在寻找一个很好的参考

使用 Clojure 进行大规模数据挖掘

我知道许多优秀的 clojure 编程书籍(Programming Clojure、Joy of Clojure……),以及许多优秀的数据挖掘教科书(挖掘海量数据集、管理千兆字节……)。但是我不知道有任何专门针对

使用 Clojure 进行大规模数据挖掘

“with clojure”部分对我来说相当重要,原因如下:

* most theoretical analysis uses big-Oh running time, which ignores constants
* constants matter, if it ends up being a matter of 1 second vs 1 hour (for things that need to be real time)
* or 1 hour vs 1 week (for batch jobs)

特别是,我认为 JVM、Clojure 数据结构之间存在很多相互作用,无论数据是存储在内存中还是从磁盘中懒惰地读取——它们可以通过“稍微”不同的实现来让“相同”的算法具有截然不同的运行时间.

因此,我的问题(以上所有内容都是为了避免被“Check Google”关闭):

用 Clojure 进行海量数据挖掘的好资源是什么?

谢谢!

4

2 回答 2

13

我认为还没有人写过一个很好的综合参考。但在这个领域肯定有很多工作正在进行(包括我自己的公司!)

一些有趣的后续链接:

于 2012-06-19T15:42:17.440 回答
1

2013 年 5 月出版了一本很棒的书:Clojure Data Analysis Cookbook。我可能会买它。

http://www.amazon.co.uk/Clojure-Data-Analysis-Cookbook-ebook/dp/B00BECVV9C/ref=sr_1_1?s=books&ie=UTF8&qid=1360697819&sr=1-1

详细地

数据无处不在,能够获得我们可以采取行动的洞察力变得越来越重要。使用 Clojure 进行数据分析和收集,本书将向您展示如何通过实用的结构化方法的基本集合从数据中获得新的见解和观点。

“Clojure 数据分析食谱”为数据分析过程的每个阶段提供了秘诀。无论是从网页上抓取数据、执行数据挖掘,还是为网络创建图表,这本书都可以完成手头的任务。

您将学习如何获取数据、清理数据并将其转换为有用的图表,然后可以对其进行分析并发布到 Internet。涵盖的内容包括高级主题,例如同时处理数据、应用贝叶斯建模等强大的统计技术,甚至是 K-means 聚类、神经网络和关联规则等数据挖掘算法。

方法

充满实用技巧的“Clojure 数据分析食谱”将通过一系列涵盖数据分析各个方面的逐步、真实世界的食谱来帮助您充分利用您的数据。

这本书是给谁看的

Clojure 和数据分析技术和工作流程的先前经验将是有益的,但不是必需的。

于 2013-02-12T19:38:09.603 回答