我正在尝试创建一个大的空 data.frame 并插入一组行。我在许多论坛上看到了一些类似的问题,但是我无法成功地将其中任何一个应用于我遇到的特定格式问题。
我从 rbind(df,allic) # allic 是我想插入到 df 中的数据框开始 # 但是,鉴于我的数据集的大小,该操作需要 5 1/2 分钟才能完成。我知道在开始时创建数据框并替换行可以提高效率,但是我无法让它解决我的问题。代码如下:
初始数据:
Order.ID Product
1 193505 Onion Rings
2 193505 Pineapple Cheddar Burger
3 193623 Fountain Soda
4 193623 French Fries
5 193623 Hamburger
6 193623 Hot Dog
7 193631 French Fries
8 193631 Hamburger
9 193631 Milkshake
产品与下面的不匹配,但这是一个格式问题,我认为最好显示将我带到现在的格式。
nb$Order.ID <- as.factor(nb$Order.ID)
plist <- aggregate(nb$Product,list(nb$Order.ID),list)
allp <- unique(unlist(plist$x))
allic <- expand.grid(plist$x[[1]], Var2=plist$x[[1]], Var3=1)
Var1 Var2 Var3
1 Onion Rings Onion Rings 1
2 Pineapple Cheddar Burger Onion Rings 1
3 Onion Rings Pineapple Cheddar Burger 1
4 Pineapple Cheddar Burger Pineapple Cheddar Burger 1
现在我使用以下方法创建一个空数据框(df):
df <- data.frame(factor=rep(NA, rcnt), factor=rep(NA,rcnt), stringsAsFactors=FALSE)
rcnt 是一个很大的任意数字,我计划在操作完成后对其进行修剪。当我尝试使用以下方法插入这些行时,我的问题就出现了:
df[1:4,] <- allic
head(df, n=10)
factor factor.1
1 47 47
2 51 47
3 47 51
4 51 51
5 NA NA
6 NA NA
7 NA NA
8 NA NA
如何在数据框中插入行而不丢失值的格式?我将不胜感激在这一点上我能得到的任何帮助。
编辑下面的每条评论:
>df[i] <- for(i in 1:nrow(plist)) {
> allic <- expand.grid(plist$x[[i]], Var2=plist$x[[i]], Var3=1)
> df[i:nrow(allic),] <- sapply(allic, as.character)
我对 R 还是很陌生,但是当我使用 df <- rbind(df,allic) 时这很有效。nrow(df) 是 4096。