2

有 3 个高负载站点(每天 >400k 独立访问者),它们都紧密连接,具有相同的管理界面,共享用户帐户等...站点具有以下统计项目:访问者、独立访问者、用户路径、引荐来源、时间现场、页面、地区、国家和浏览器。统计信息由第 3 方服务汇总和处理,但该服务无法以方便的方式提供跨站点统计信息(大量手动检查和跟踪用户),因此我想构建一个统计解决方案,该解决方案将提供上述功能和还提供跨站统计。现在我有疑问:我应该用什么来存储?首先,我尝试使用良好的旧 MySQL,但完全失败了:性能和可伸缩性问题扼杀了整个想法。所以我开始研究 NoSQL 解决方案,但我没有

  • 非阻塞映射/减少。Map/Reduce 不应该阻止收集写入(所以当管理员请求一些统计数据站点时仍然能够添加访问者记录)
  • 易于扩展。
  • 用户被计算在请求生命周期的开始,因此数据库的响应应该非常快

有任何想法吗?

4

1 回答 1

1

在从春季的一次会议中获取一些免费赠品时,我花了几分钟的时间观看了一个涵盖多个 mongoDB 用例的演示文稿,其中一个似乎适用的是ServerDensity的案例。他们的博客文章描述了一个类似的大容量日志系统,以及他们决定从 mySQL 迁移到 MongoDB 的原因,特别是为什么使用 mongoDB 而不是竞争对手。还有其他类似的演示文稿,例如EventbriteYottaDevmash

还有一章(5 - Web Analytics using MongoDB),PHP and MongoDB Web Development Beginner's Guide,Rubayeet Islam,涵盖了构建这样一个系统。

于 2013-09-03T23:31:06.287 回答