我正在做一个项目,从网络爬虫获取数据并进行一些文本分析(实际技术仍有待讨论)。我目前正在使用 crawler4j 进行网络爬取,并希望将 Java 数据挖掘包 (JDMP) 用于分析部分。我考虑过其他软件包,例如 Apache Mahout(这不在表格中,但我发现设置 hadoop/maven 设置尤其是在 Windows 中很困难)。无论如何,我想要一些详细说明如何使用 JDMP 的教程/代码。我在网上搜索,但在这方面找不到任何有用的东西。如果有人能推荐一些好的 JDMP 教程,我将不胜感激。
谢谢。