word <- c('abc noboby@stat.berkeley.edu','text with no email','first me@mything.com also you@yourspace.com')
pattern <- '[-A-Za-z0-9_.%]+@[-A-Za-z0-9_.%]+\\.[A-Za-z]+'
getmail<-function(pattern,word){
mail<<-c()
sapply(word,function(x){
out<-gregexpr(pattern,x)
for (i in 1:length(out[[1]])){
if (out[[1]][i]>0)
mail<<-union(mail,substr(x,start=out[[1]][i],stop=out[[1]][i]+attr(out[[1]],"match.length")[i]-1))
}})
return(mail)
}
getmail(pattern,word)
[1] "noboby@stat.berkeley.edu" "me@mything.com" "you@yourspace.com"
ls()
[1] "getmail" "mail" "pattern" "word"
该函数得到结果,但我觉得如果mail
我运行 getmail(pattern,word) 后命名空间中没有全局变量会更好,我该如何修改它?不要删除 sapply 函数,按照我的方式做,只是不要让mail
在命名空间中。
我知道我可以用更简单的方式得到结果,但我想了解更多关于函数的知识。
mail<-c()
out<-gregexpr(pattern,word)
for (i in 1:length(out)){
for (j in 1:length(out[[i]])){
if (out[[i]][j]>0)
mail<-union(mail,substr(word[i],start=out[[i]][j],stop=out[[i]][j]+attr(out[[i]],"match.length")[j]-1))}}
mail
[1] "noboby@stat.berkeley.edu" "me@mything.com" "you@yourspace.com"