嗨,我试图在第 7 章(k-Mean Clustering)中运行 Mahout 中的示例。有人可以指导我如何使用 Mahout(0.7) 在 Hadoop 集群(单节点 CDH-4.2.1)中运行该示例
这些是我遵循的步骤:
将代码(来自Github)复制到我的 Eclipse IDE 中,在我的本地机器上。
将这些 jars 包含到我的 Eclipse 项目中。
hadoop-common-2.0.0-cdh4.2.1.jar
hadoop-hdfs-2.0.0-cdh4.2.1.jar
hadoop-mapreduce-client-core-2.0.0-cdh4.2.1.jar
mahout-core-0.7-cdh4.3.0.jar
mahout-core-0.7-cdh4.3.0-job.jar
mahout-math-0.7-cdh4.3.0.jar
制作了这个项目的 Jar 并将该 jar 复制到我的 Hadoop 集群中
执行了这个命令
user@INFPH01463U:~$ hadoop jar /home/user/apurv/Kmean.jar tryout.SimpleKMeansClustering
这给了我以下错误
Exception in thread "main" java.lang.NoClassDefFoundError: FileSystem
at java.lang.Class.getDeclaredMethods0(Native Method)
at java.lang.Class.privateGetDeclaredMethods(Class.java:2427)
at java.lang.Class.getMethod0(Class.java:2670)
at java.lang.Class.getMethod(Class.java:1603)
at org.apache.hadoop.util.RunJar.main(RunJar.java:202)
Caused by: java.lang.ClassNotFoundException: FileSystem
at java.net.URLClassLoader$1.run(URLClassLoader.java:202)
at java.security.AccessController.doPrivileged(Native Method)
at java.net.URLClassLoader.findClass(URLClassLoader.java:190)
at java.lang.ClassLoader.loadClass(ClassLoader.java:306)
at java.lang.ClassLoader.loadClass(ClassLoader.java:247)
... 5 more
任何人都可以帮助我解决我所缺少的或者我的执行方式错误吗?
其次,我想知道如何在 CSV 文件上运行 K-mean Clustering?
提前致谢 :)