1

我刚刚开始使用 mahout,并且正在考虑从我现有的数据中构建一个推荐引擎。我当前表中的数据以如下格式存储

userId  From      TO        Meal    Carrier            Travel type

MT001   London    Abu Dhabi Non-Veg Lufthansa          International
MT001   Abu Dhabi Beijing   Veg     Lufthansa          International
MT001   New York  Chicago   Non-Veg American Airlines  Domestic
MT002   New York  Texas     Veg     American Airlines  Domestic

现在我想将此数据集转换为 mahout 接受的数据模型。我知道 mahout 数据模型的格式就像

userId(int),itemId(int),偏好值(float)

谁能建议我如何将上面的旅行数据集(其中包含比 mohout 数据模型更多的列和不同的数据类型)转换为 mahout 支持的数据模型。任何帮助将不胜感激。

4

1 回答 1

1

我想你必须重写你的数据模型类,尝试扩展和重写 AbstractDataModel 类,你也可以尝试使用框架中提供的 IDMigrator 控件将你的字符串转换为整数值。

浏览这个主题 - Mahout:读取自定义输入文件

于 2013-06-02T09:26:33.817 回答