4

我有一个首字母变量,名称错误地分散在整个列表中。请参见下面的示例结构:

ID <- c('SPW', 'SM', 'DLS', 'SJ', 'joe.schmoe', 'CEJ', 'teddy.roos', 'GVF', 'MJC',  
        'LH', 'sally.fields') ## Full names shouldn't be there -- only initials.
test <- data.frame(ID)

我想创建一个新变量(ID2),它切换出任何带有指定首字母的名称。否则,我希望 ID2 包含 ID 的首字母。我目前不成功的代码示例有望说明:

swfun <- function(x) {
    switch(x,
        'joe.schmoe' = 'JS',
        'teddy.roos' = 'TR',
        'sally.fields' = 'SF',
        as.character(test$ID)
        )
    } ## In other words, I've created a switch function to replace any names   
              ## with requisite initials. I was 'hoping' that the last command   
              ## [as.character(test$ID)] would populate the rest of ID2 with values 
              ## from test$ID.
test$ID2 <- sapply(test$ID, swfun)

而不是得到test$ID2 <- c('SPW', 'SM', 'DLS', 'SJ', 'JS', 'CEJ', 'TR', 'GVF', 'MJC', 'LH', 'SF'),

我越来越test$ID2 <- list(NULL, NULL, "TR", NULL, c("SPW", "SM", "DLS", "SJ", "joe.schmoe", "CEJ", "teddy.roos", "GVF", "MJC", "LH", "sally.fields"), "JS", NULL, "SF", NULL, NULL, NULL)

这个问题类似于我之前提出的问题(R: ifelse on string),但是增加了用前一列的值填充列的其余部分的变化。此外,我想解决这个问题,switch因为我对该功能还很陌生。

4

1 回答 1

2

只需将 switch 函数中的最后一行切换为使用x而不是test$ID

swfun <- function(x) {
    switch(x,
        'joe.schmoe' = 'JS',
        'teddy.roos' = 'TR',
        'sally.fields' = 'SF',
        as.character(x)
        )
    }

结果

> unname(sapply(ID, swfun))
 [1] "SPW" "SM"  "DLS" "SJ"  "JS"  "CEJ" "TR"  "GVF" "MJC"
[10] "LH"  "SF" 

Edit re Vectorize (Frank):如果你发现自己sapply经常这样做,你可能会考虑

swfun2 <- Vectorize(swfun)
unname(swfun2(ID))
 [1] "SPW" "SM"  "DLS" "SJ"  "JS"  "CEJ" "TR"  "GVF" "MJC"
[10] "LH"  "SF" 

或下面评论中链接的替代方案。

于 2013-09-23T02:23:54.133 回答