0

下面的代码是关于超过10个房间的房屋过采样,请问是什么prob = ifelse(housing.df$ROOMS>10, 0.9, 0.01)意思?非常感谢。

s <- sample(row.names(housing.df), 5, pro = ifelse(housing.df$ROOMS>10, 0.9, 0.01))
housing.df[s.]
4

1 回答 1

0

我想这个 ccode 的目的是首先检查数据集中给定的房子是否有十个房间。如果是这样,那么它的概率是 90%,否则它的概率是 10%

sample使用这个相关的概率从给定的房子名称中抽样,因此在抽样时有利于那些有十个以上房间的房子。这将创建您的过度样本。

你是这个意思吗?

于 2019-09-14T00:45:46.997 回答