我需要将时间戳(movielens 数据集)添加到斜率一算法中以使其更准确。
我以为我应该修改源代码( mahout-core/...cf/taste/impl/recommender/ slopeone中的 MemoryDiffStorage.java),但我不知道如何添加时间戳。
即使我Long getPreferenceTime(long userID, long itemID)
在DataModle.java中找到了定义,我仍然不知道它。
我应该说我是 Java 和 Mahout 的新手。所以请给我详细解释一下!谢谢~ :)
在下面添加修改代码:) 原始代码在 MemoryDiffStorage.java 中,我只是插入了一些语句。我想知道我是否插入错误的地方,但我认为这是它获取值的地方。
private long processOneUser(long averageCount, long userID) throws TasteException {
log.debug("Processing prefs for user {}", userID);
// Save off prefs for the life of this loop iteration
PreferenceArray userPreferences = dataModel.getPreferencesFromUser(userID);
int length = userPreferences.length();
for (int i = 0; i < length - 1; i++) {
float prefAValue = userPreferences.getValue(i);
long itemIDA = userPreferences.getItemID(i);
long Timestamp = dataModel.getPreferenceTime(userID, itemIDA);
long timestamp_max = 1046388675;
long timestamp_min = 975042787;
long t = (Timestamp - timestamp_min)/(timestamp_max - timestamp_min);
prefAValue = prefAValue * t;
FastByIDMap<RunningAverage> aMap = averageDiffs.get(itemIDA);
if (aMap == null) {
aMap = new FastByIDMap<RunningAverage>();
averageDiffs.put(itemIDA, aMap);
}
for (int j = i + 1; j < length; j++) {
// This is a performance-critical block
long itemIDB = userPreferences.getItemID(j);
RunningAverage average = aMap.get(itemIDB);
if (average == null && averageCount < maxEntries) {
average = buildRunningAverage();
aMap.put(itemIDB, average);
averageCount++;
}
if (average != null) {
average.addDatum(userPreferences.getValue(j) - prefAValue);
}
}