0

我是 Apache Mahout 的新手,正在研究分类问题。

问题状态:文本文件中存在一组数据,我需要根据给定的时间跨度从文件中获取部分或全部数据。

时间跨度:每条记录都有一个交易日期。
因此,将使用逻辑 (Sys_Date - Transaction_Date) 计算时间跨度。

因此,输出将根据是否需要上个月/一周/特定天数的数据而有所不同。
如何使用 Apache Mahout 实现此过滤。

4

2 回答 2

1

这本身听起来根本不像是机器学习问题。您希望将数据放入某种数据库中并查询日期范围内的记录。然后,您想对这些数据做一些事情。这不是 ML 工具所做的事情。

于 2012-12-12T08:47:13.020 回答
0

我还没有正确使用hadoop。但在我看来,这个视频应该有帮助: http ://www.youtube.com/watch?v=KwW7bQRykHI&feature=player_embedded

过滤后,可以在 mahout 中使用 result(用于解决分类问题)

于 2012-12-17T13:39:27.517 回答