我有一个看起来像这样的大型数据集:
5 6 5 6 3 5
2 5 3 7 1 6
4 8 1 8 6 9
1 5 2 9 4 5
对于每一行,我想从第二个字段中减去第一个字段,从第四个字段中减去第三个字段,依此类推,加深字段数(总是偶数)。然后,我想报告所有对的差异超过某个限制(比如 2)的那些行。我还应该能够报告下一个最佳行,即其中一对比较未能达到限制但所有其他对都符合限制的行。
从上面的示例中,如果我将限制设置为 2,那么我的输出文件应该包含最佳行:
2 5 3 7 1 6 # because (5-2), (7-3), (6-1) are all > 2
4 8 1 8 6 9 # because (8-4), (8-1), (9-6) are all > 2
下一个最佳行
1 5 2 9 4 5 # because except (5-4), both (5-1) and (9-2) are > 2
我目前的方法是读取每一行,将每个字段保存为变量,做减法。但我不知道如何进一步进行。
谢谢,