r - RWeka 离散化结果

翻译自：https://stackoverflow.com/questions/16680150 2013-05-21T21:54:41.823

628 次

我正在尝试使用 RWeka 的Discretize过滤器离散化一组数据。我的数据集开始时有超过一百万条记录，但返回的集只有大约 10 万条。该函数看起来应该返回集合中每条记录的 bin，所以我很好奇 90% 的数据去了哪里？

数据中有 NA，所以我尝试得到以下结果：

> disc_data = Discretize(class~.,data=num_data, na.action=na.pass)
Error in .jarray(x) : java.lang.OutOfMemoryError: Java heap space

我正在使用其他人的代码，以前似乎没有问题。我不确定这是否是对离散化或 R 缺乏理解。有人可以解释一下Discretize假设是如何工作的以及发生了什么吗？

0 回答 0