5

螃蟹的基准是(http://www.slideshare.net/marcelcaraciolo/crab-a-python-framework-for-building-recommender-systems page-37)

基准纯 Python w/ Python w/ Scipy Dataset dicts 和 NumpyMovieLens 100k 15.32 s 9.56 s http://www.grouplens.org/node/73 Old Crab New Crab

但是,就我而言,我需要花费 30 多分钟才能完成,我不知道原因

我的代码是

model = MatrixPreferenceDataModel(recommend_data.data)
similarity = UserSimilarity(model, pearson_correlation)
recommender = UserBasedRecommender(model, similarity, with_preference=True)
recommender.recommend("6")

我的数据是 NumpyMovieLens 100k,其中包含来自 1000 名用户对 1700 部电影的 100,000 条评分。

4

2 回答 2

1

螃蟹正在重新设计。数据操作将更有效且更少依赖外部库。它自己的 API 将被简化。我们希望尽快发布稳定版本,以便社区参与进来。目标是创建一个框架来填补 Python 中的这一空白。该项目托管在这里https://github.com/python-recsys/crab

非常欢迎帮助和建议。

于 2013-09-30T03:48:37.820 回答
1

一年多前我上次看 Crab 时,它使用的是密集数组,它应该使用稀疏矩阵(例如scipy.sparse)。这让它变得非常缓慢,而且非常耗费内存。刚扫了一眼,Crab 好像快一年没更新了,所以情况大概还是一样吧。

于 2013-01-16T10:44:16.447 回答