我有以下想在 awk 中解决的问题。我有一个大文本表,逗号分隔,由 100k 行和 5k 列组成。第一行是标题,第一列是记录 ID。然后我有第二个文本文件,其中包含第一个文件中标题的子集。我想提取第一个文件的所有列,其标题包含在第二个文件中给出的列表中。这是输入和所需输出的示例:
数据.TXT
ID, head1, head2, head3, head4
1, 25.5, 1364.0, 22.5, 13.2
2, 10.1, 215.56, 1.15, 22.2
列表.TXT
head1
head4
期望的输出:
ID, head1, head4
1, 25.5, 13.2
2, 10.1, 22.2
任何人都可以就如何在 awk 中或通过 unix 脚本解决这个问题给我一些建议?提前感谢您的帮助!