考虑下面的数据集。每个以数字开头的块都是一个“案例”。在真实的数据集中,我有数十万个案例。当一个案例中只有一个词排除时(例如案例 10001),我想将“排除”一词替换为“0”。
如果我遍历行,我可以计算每种情况下我有多少“排除”。但是,如果只有一行带有“排除”一词,我不知道如何回到该行并替换该词。
我怎样才能做到这一点?
10001
M1|F1|SP1;12;12;12;11;13;10;Exclusion;D16S539
M1|F1|SP1;12;10;12;9;11;9;3.60;D16S
M1|F1|SP1;12;10;10;7;11;7;20.00;D7S
M1|F1|SP1;13;12;12;12;12;12;3.91;D13S
M1|F1|SP1;11;11;13;11;13;11;3.27;D5S
M1|F1|SP1;14;12;14;10;12;10;1.99;CSF
10002
M1|F1|SP1;8;13;13;8;8;12;2.91;D16S
M1|F1|SP1;13;11;13;10;10;10;4.13;D7S
M1|F1|SP1;12;9;12;10;11;16;Exclusion;D13S
M1|F1|SP1;12;10;12;10;14;15;Exclusion;D5S
M1|F1|SP1;13;10;10;10;17;18;Exclusion;CSF