原始表
CELL NUMBER ----------ACTIVITY--------TIME<br/>
001................................call a................12.23<br/>
002................................call b................01.00<br/>
002................................call d................01.09<br/>
001................................call b................12.25<br/>
003................................call a................12.23<br/>
002................................call a................02.07<br/>
003................................call b................12.25<br/>
必需的-
从 400,000 大小的数据集中挖掘 ACTIVITY 的最高出现序列
上面的例子应该显示
[call a-12.23,call b-12.25] frequency 2<br/>
[call b-01.00,call d-01.09,call a-02.07] frequency 1
我知道这可以使用arulesSequences
. 我需要对数据集进行哪些转换以及如何使用该arulesSequences
包?
当前 db 格式 - 具有 3 列的事务,如上面的示例。