2

我想在文章发布平台之上构建一个分析引擎。更具体地说,我想跟踪用户的阅读行为(例如文章的浏览次数、打开文章所花费的时间、评分等),以及文章本身的统计信息(例如段落数、作者等) )。

这将有两个目的:

  1. 提供有关用户和文章的见解
  2. 向用户提供建议

对于数据分析部分,我一直在研究cubespandaspytables。数据很多,存储在 MySQL 表中;我不确定这些软件包中的哪一个会更好地处理这样的后端。

对于推荐部分,我只是考虑将数据从数据分析引擎提供给聚类模型。

关于如何将所有这些放在一起的任何建议,以及可以帮助我的很酷的 python 项目?如果我应该提供更多信息,请告诉我。

谢谢

4

2 回答 2

3

Scikit-learn应该让您对数据处理(聚类)部分感到满意​​。

于 2012-09-14T14:37:24.347 回答
2

对于分析和可视化方面,你有你提到的Cubes ,对于我来说,我使用我编写的CubesViewer

于 2013-10-30T13:43:05.400 回答