我正在尝试将长数据框转换为宽且带有标记的案例。我旋转它并使用一个临时向量作为标志。它在小型数据集上完美运行:请参阅示例(复制并粘贴到您的 Rstudio),但是当我尝试对真实数据执行此操作时,它会报告错误:
churnTrain3 <- spread(churnTrain, key = "state", value = "temporary", fill = 0) 错误:行 (169, 249), (57, 109), (11, 226) 的标识符重复
结构范围的数据集与进一步处理相关 是否有任何解决此问题的方法。我敢打赌,很多人试图清理数据并解决同样的问题。请帮帮我这是代码: 第一个块“示例”制作小数据集以实现良好的可视化效果 第二个块“真实数据”是来自流失库的数据集的切片部分
library(caret)
library(tidyr)
#example
#============
df <- data.frame(var1 = (1:6),
var2 = (7:12),
factors = c("facto1", "facto2", "facto3", "facto3","facto5", "facto1") ,
flags = c(1, 1, 1, 1, 1, 1))
df
df2 <- spread(data = df, key = "factors" , value = flags, fill = " ")
df2
#=============
# real data
#============
data(churn)
str(churnTrain)
churnTrain <- churnTrain[1:250,1:4]
churnTrain$temporary <-1
churnTrain3 <- spread(churnTrain, key = "state", value = "temporary", fill = 0)
str(churnTrain)
head(churnTrain3)
str(churnTrain3)
#============