我正在使用包“arules”来挖掘我的大数据中的频繁项集,但我找不到合适的离散化方法。
作为包'arules'中的示例,可以在函数'离散化'中使用几种基本的无监督方法,但我想估计我的大型数据集中的最佳类别数,这似乎比分配类别数更合理。
能否给我一些好的建议,谢谢。
我正在使用包“arules”来挖掘我的大数据中的频繁项集,但我找不到合适的离散化方法。
作为包'arules'中的示例,可以在函数'离散化'中使用几种基本的无监督方法,但我想估计我的大型数据集中的最佳类别数,这似乎比分配类别数更合理。
能否给我一些好的建议,谢谢。