1

I am working on movielens 100K movie data for recommendation system. I divide the data into test and training and calculate the precision and recall. In testing there are more than 10K users chosen randomly. I am able to find the precision and recall for an individual user.

I wanted to know: Is there any practical importance to the aggregated precision and recall?

4

1 回答 1

0

您将看到学术论文中报告的 Precision/Recall 结果是一个汇总,而不是 10,000 个不同的 P/R 结果。在这方面,它使读者对 RS 性能有一个非常普遍的认识。通常,您会看到以曲线表示的 Precision/Recall(如此处所示:http ://www.cs.washington.edu/ai/mln/images/image001.png )。您往往会看到,在 Recall = 1 时,Precision 较低,而在 Precision = 1 时,Recall 较低。您可以根据 10,000 个结果在 Excel 或 Google 表格中轻松创建其中一条曲线。

正如评论中提到的,F-measure 是一种组合 P/R 以生成平均值的方法,尽管在“吹嘘”它之前,您需要了解 F 测量的局限性。根据您的应用领域,为精度或召回率证明某种权重的情况并不少见,因此请注意基本的 F 度量是平衡的(精度和召回率都被视为同等重要)。

Receiver Operator Characteristic ( https://en.wikipedia.org/wiki/Receiver_operating_characteristic ) 也常用于侧边 P/R 曲线和推荐系统评估中的 f-measure。如果您正在寻找额外的信用,那么我建议您使用多种方法来评估 RS 性能,例如 P/R 曲线、F 度量、AUC 和 ROC。

于 2015-08-01T17:57:14.057 回答