5

我是一名 PHP 开发人员。让我们现在就解决这个问题。但是Hadoop——尤其Mahout—— 激起了我的兴趣。为了使用它们,我已准备好深入研究 Java。

所以从经验丰富的人那里知道,我需要多少 Java 才能有效地使用这些?据我所见,编程映射器/减速器并不需要那么多。但是对于 Mahout,当我查看文档时,我完全不确定自己在看什么。

此外,从我的 PHP 应用程序中获取数据以通过 Hadoop 和 Mahout 在 Java 中进行处理有多难?我无法想象它会那么困难,但我没有足够的经验说。

4

4 回答 4

7

使用 Mahout 和 Hadoop 将数据从 PHP 获取到 Java 进行分析应该不难。

更简单的是使用 Mahout 和 Hadoop 以批处理模式离线处理并将数据产品存储在文件系统或数据库中。然后 PHP 可以像从日志上掉下来一样轻松地读取这些数据产品。

对于实时使用,Mahout 的推荐部分支持各种 Web 服务接口,使其非常容易从 PHP 访问。完成 Mahout 的模型评估部分需要更多的编程。

于 2010-07-22T19:51:08.363 回答
1

我只是做了同样的事情,多年来我一直在做任何与 Java 相关的事情。我所做的是以下内容:

  1. 从简单的 Hadoop 流示例开始
  2. 用 PHP 流式尝试我自己的分析
  3. 开始尝试 Pig
  4. 开始尝试在 Pig 中使用 PHP 流式传输

全部没有任何Java!

于 2010-12-08T18:26:10.257 回答
1

Java的初级水平就足够了。您可以随时根据临时需求深入挖掘。

于 2010-08-18T21:26:40.420 回答
0

对于实时推荐,您还可以在 java servlet 类中实例化 mahout 的实例,然后将其作为战争服务导出到 tomcat 服务器上。

于 2011-08-19T23:47:26.460 回答