假设我有如下所述的数据。
11AM user1刷机
上午 11:05 用户 1 准备早餐
11:10 AM user1 吃早餐
上午 11:15 用户 1 洗澡
上午 11:30 用户 1 离开办公室
12PM user2刷机
12:05PM user2 准备早餐
12:10 PM user2 吃早餐
12:15 PM user2 洗澡
12:30 PM user2 离开办公室
11AM user3 洗澡
上午 11:05 用户 3 准备早餐
11:10AM user3刷机
11:15AM user3 吃早餐
上午 11:30 用户 3 离开办公室
12PM 用户4 洗澡
12:05PM user4 准备早餐
12:10PM user4刷机
12:15 PM user4 吃早餐
12:30 PM user4 离开办公室
这些数据告诉我不同人的日常生活。从这些数据看来,user1 和 user2 的行为相似(尽管它们执行活动的时间有所不同,但它们遵循相同的顺序)。出于同样的原因,User3 和 User4 的行为相似。现在我必须将这些用户分组到不同的组中。在此示例中,group1- user1 和 USer2 ... 后跟 group2,包括 user3 和 user4
我应该如何处理这种情况。我正在尝试学习数据挖掘,这是一个我认为是数据挖掘问题的例子。我正在尝试找到解决方案的方法,但我想不出一个。我相信这些数据中有规律。但我无法想到可以揭示它的方法。此外,我必须将这种方法映射到我拥有的数据集上,该数据集非常庞大但与此类似:) 数据是关于一次记录事件发生的日志。我想找到代表类似事件序列的组。
任何指针将不胜感激。