awk - 修改和比较两个文件的相似性

Question

我有 2 个文件。file1的样本值如下：

file2的样本值如下：

我正在尝试修改file1并使用以下值创建一个file3（如您所见，file1最后一列中的值无关紧要）：

另外，需要修改file2 ，创建一个file4，其值如下（file2最后一列的值无关）：

创建file3和file4 后，我打算使用diff实用程序检查它们的相似性。要生成file3和file4，我正在尝试编写一个awk脚本。但作为初学者awk，我发现这项任务非常耗时。任何指导将不胜感激。

score 1 · Accepted Answer

我们可以从第一行捕获值$1，然后在公式中使用它来计算偏移量。这假设最小$1的是在第一行。

awk 'NR==1 { i=$1 } { print $1-i+1,$2 }'

例如，您可以这样做：

awk 'NR==1 { i=$1 } { print $1-i+1,$2 }' file1 > file3
awk 'NR==1 { i=$1 } { print $1-i+1,$2 }' file2 > file4
diff file3 file4

这是我之前的版本，在我注意到您真的在寻找偏移量之前。我以为您只是想根据$1. 我们可以设置一个变量来检查行之间的值变化，并且只在$1变化时增加计数器。这假设是分组的。

awk 'n!=$1 { i++ } { print i,$2 } { n=$1 }'

例如，您可以这样做：

awk 'n!=$1 { i++ } { print i,$2 } { n=$1 }' file1 > file3
awk 'n!=$1 { i++ } { print i,$2 } { n=$1 }' file2 > file4
diff file3 file4

1 回答 1