目前,我想做一些关于聊天消息的数据挖掘项目/研究。我有一个消息源,它全天以约 10 条消息/秒的速度传递聊天消息。每条消息都有以下信息,我想为每条消息存储所有信息:
ID, CHANNEL, DATE, USER, MESSAGE
我希望能够显示实时统计数据,根据在以下时间间隔内分别收到/发送多少消息对频道/用户进行排名:
This Minute, This Hour, This Day, This Month, This Year
我还希望在指定的时间段内有效地绘制任何特定通道或用户的活动(通过消息计数)或两者的组合,并以指定的精度级别计算消息。
Q1:我应该使用什么样的数据库设置来有效地存储所有这些信息?
Q2:我应该使用什么样的方法来尽可能高效、快速地向多个客户展示上述实时信息?
谢谢。