0

我试图平衡我的数据,其中多数类的比例为 99%,而稀有类的比例为 1%。我的响应变量是二进制的,我的自变量是二进制、整数和分类变量。

我正在使用 ROSE 包的 ROSE 函数,但出现以下错误:“rose.sampl(n, N, p, ind.majo, majoY, ind.mino, minoY, y, classy, 中的错误:当前实现ROSE 只处理连续变量和分类变量。”

我知道错误是由于我的自变量造成的,但我无法弄清楚这个错误的主要原因是什么以及如何解决它。你有遇到过这样的错误吗?

4

1 回答 1

2

我也有类似的信息。原来我的一个自变量是一个 difftime 对象,而它应该是数字的。

ROSE 包的文档声明它接受整数或数字格式的连续变量,以及因子格式的分类变量,因为它的 accuracy.meas 和 roc.curve 函数。ROSE 函数可能是相同的。了解变量的类别会有所帮助,但请考虑分解您的二进制列或确保您的其他变量符合这些数据类型。

于 2019-07-10T06:35:50.027 回答