我有一个包含大约 75,000 个观察值的数据集,我想在第一步中稍微准备一下。
例如我想在某个条件下设置一个变量。
我现在的经典方法是逐行迭代完整的数据集。检查每一行中的条件,然后设置变量。
这是正确的方法,尤其是在计算时间方面?
for (row in 1:nrow(kader_test)) {
if (kader_test[row,]$saison <= kader_test[row,]$jahr_im_team_seit) {
kader_test[row,]$gespielt_von = kader_test[row,]$im_team_seit
}
}
Nach der FOR Schleife sieht man, dass sich in Zeile 1 und 6 etwas geändert hat。Gibt es hierfür einen Eleganteren Weg?
谢谢你。