r - 简化可怕的 R 代码以调整行均值

Question

我知道使用 R 强大的矢量处理功能可以使这段代码更短、更高效。我只是现在无法弄清楚如何......

基本任务是调整每行中的单元格，以便强制行总数匹配由另一个数据框确定的预定义数字。这样，每个区域的总人口被强制为某个值（每一行代表一个区域），而从一列移动到下一列的单元格之间的比率保持不变。

丑陋的做法（第一个循环只是创建一个示例数据框；当然可以做得更好；我就是不能停止使用循环！）：

con1 <- array(dim=c(5,3))

set.seed(1066)
for(i in 1:ncol(con1)){
con1[,i] <- round(rnorm(n=5,mean=10,sd=3))}
con1 <- data.frame(con1)
con2 <- data.frame(array(c(8:13, 9:14, 10:15), dim=c(5,3)))

apply(con1,1, sum)
apply(con2,1, sum) # different row totals

con1.adj <- con1
for ( i in 1:nrow(con1)){
  con1.adj[i,1] <- con1[i,1] * ( sum(con2[i,]) / sum(con1[i,]) )
  con1.adj[i,2] <- con1[i,2] * ( sum(con2[i,]) / sum(con1[i,]) )
  con1.adj[i,3] <- con1[i,3] * ( sum(con2[i,]) / sum(con1[i,]) )
}
con1.adj <- data.frame(con1.adj)
apply(con1.adj,1, sum) # same row totals

（上下文：从别人的工作中挖出这段代码并愉快地使用了一段时间。现在我看起来很糟糕，因为我已经在陡峭的 R 学习曲线上稍微上升了一点。还希望代码被重新使用其他人。真的很喜欢这种语言，如果我能找到一种更漂亮的方式，我会更喜欢它）

score 15 · Accepted Answer

我认为这个单线应该可以完成这项工作：

con1.adj <- con1 * rowSums(con2) / rowSums(con1)

score 2 · Accepted Answer

con1这是另一个建议，以更好的方式生成您的

rgen <- function(X,mean=10,sd=3){
  round(rnorm(n=length(X),mean=mean,sd=sd))
}

con1 <- data.frame(apply(con1,2,rgen))

请注意，您的随机向量的大小将与您的维度相匹配array，您可以动态传递不同的值mean，sd例如apply(con1,2,rgen,5,2)生成rnormmean=5sd=2

r - 简化可怕的 R 代码以调整行均值

2 回答 2

Related

Reference