我正在尝试在R
. 数据集如下:
https ://drive.google.com/file/d/1FVh-Xg3NBtzKgZHnDTi7IjaATW_fPmW9/view?usp=sharing
beer_data <- read.csv("beer_data.csv", stringsAsFactors = F)
library(recommenderlab)
r <- as(beer_data, "realRatingMatrix")
现在,如果我们检查每个对象中的评论数量,两者都不匹配
nrow(beer_data) # 475984
length(getRatings(r)) # 474560
而且评级范围也不匹配:
> range(beer_data_master$review_overall)
[1] 0 5
> range(getRatings(r))
[1] 0 15
我也检查了其他数据集,没有出现问题。