我有 3 列。第一列具有唯一 ID,第二列和第三列具有字符串数据和一些 NA 数据。我需要从第 2 列中提取信息并将其放在单独的列中,并对第 3 列执行相同的操作。我正在使用 for 循环构建如下函数。我需要在第三个字母之后拆分列。[例如在下面的 V1 列中,我需要将 AAAbbb 分解为 AAA 和 bbb 并将它们放在单独的列中。我知道我可以使用 substr 来做到这一点。我是R新手,请帮忙。
UID * V1 * V2 *
Z001NL * AAAbbb * IADSFO *
Z001NP * IADSFO * 不适用 *
Z0024G * SFOHNL * NLSFO0 *
这是我的代码。
test=read.csv("c:/some/path/in/windows/test.csv", header=TRUE)
substring_it = function(test)
{
for(i in 1:3){
for(j in 2:3){
answer = transform(test, code 1 = substr((test[[j,i]]), 1, 3), code2 = substr((test[j,i]), 4, 6))
}
}
return(answer)
}
hello = substring_it(test)
test 将是我将读入的数据框。
我需要这个作为我的输出
UID * V1.1 * V1.2 * V2.1 * V2.2
Z001NL * AAA * bbb * IAD * SFO
Z001NP * IAD * SFO * 不适用 * 不适用
Z0024G * SFO * HNL * NLS * SFO