5

我找到了许多关于如何使用一个模式和一个替换来匹配和更新整个列表的示例,但我现在正在寻找的是一种在单个语句或循环中为多个模式和多个替换执行此操作的方法。

例子:

> print(recs)
  phonenumber amount
1     5345091    200
2     5386052    200
3     5413949    600
4     7420155    700
5     7992284    600

我想插入一个名为“service_provider”的新列,其中 /^5/ 作为 Company1,/^7/ 作为 Company2。

我可以用以下两行 R 来做到这一点:

recs$service_provider[grepl("^5", recs$phonenumber)]<-"Company1"
recs$service_provider[grepl("^7", recs$phonenumber)]<-"Company2"

然后我得到:

  phonenumber amount service_provider
1     5345091    200          Company1
2     5386052    200          Company1
3     5413949    600          Company1
4     7420155    700          Company2
5     7992284    600          Company2

我想提供一个列表,而不是一组离散的 grepl,这样更容易将特定国家/地区的信息保存在一个地方,并将所有编程逻辑保存在另一个地方。

thisPhoneCompanies<-list(c('^5','Company1'),c('^7','Company2'))

在其他语言中,我会在电话公司列表上使用 for 循环

For every row in thisPhoneCompanies
    Add service provider to matched entries in recs (such as the grepl statement)
end loop

但我知道这不是在 R中做到这一点的方法。

4

2 回答 2

4

使用stringi

library(stringi)
recs$service_provider <- stri_replace_all_regex(str = recs$phonenumber,
                                        pattern = c('^5.*','^7.*'), 
                                        replacement = c('Company1', 'Company2'),
                                        vectorize_all = FALSE)

recs
#   phonenumber amount service_provider
# 1     5345091    200         Company1
# 2     5386052    200         Company1
# 3     5413949    600         Company1
# 4     7420155    700         Company2
# 5     7992284    600         Company2
于 2015-03-16T06:24:39.833 回答
0

感谢@thelatemail

看起来如果我使用数据框而不是电话公司的列表:

phcomp <- data.frame(ph=c(5,7),comp=c("Company1","Company2")) 

我可以在一个命令中匹配并添加一个新列到我的电话号码列表中(使用匹配功能)。

recs$service_provider <- phcomp$comp[match(substr(recs$phonenumber,1,1), phcomp$ph)]

看起来我失去了使用正则表达式的能力,但是这里的匹配很简单,只是电话号码的第一位。

于 2015-03-16T06:20:08.633 回答