1

我想根据 .txt 文件中的特定字符对文件进行排序。

这是给我的文件:

12345678901234567890123456789012345
header     1stfoo   DDMMYYYY 2ndfoo
sltele     Hoodie   24051988 d12Hdq
sltele     Hoodie   07051987 d30Hdq
sltele     Hoodie   07082011 d08Hdq
sltele     Hoodie   09081961 d04Hdq
sltele     Hoodie   20041962 d14Hdq
sltele     Hoodie   20032000 d01Hdq
sltele     Hoodie   13062002 d05Hdq

如您所见,有一列包含 DDMMYYY 格式的日期。如果我对它进行排序, sort -n -k 3,3 thisfile.txt > sortedfile.txt我得到了这个结果:

sltele     Hoodie   07051987 d30Hdq
sltele     Hoodie   07082011 d08Hdq
sltele     Hoodie   09081961 d04Hdq
sltele     Hoodie   13062002 d05Hdq
sltele     Hoodie   20032000 d01Hdq
sltele     Hoodie   20041962 d14Hdq
sltele     Hoodie   24051988 d12Hdq

但是,我想要这样的结果:

sltele     Hoodie   09081961 d04Hdq
sltele     Hoodie   20041962 d14Hdq
sltele     Hoodie   07051987 d30Hdq
sltele     Hoodie   24051988 d12Hdq
sltele     Hoodie   20032000 d01Hdq
sltele     Hoodie   13062002 d05Hdq
sltele     Hoodie   07082011 d08Hdq

作为基于 DDMMYYYY 日期格式的有效 sortedfile.txt。

有人可以帮我吗?

提前致谢

4

3 回答 3

3

您可以使用 sort 命令,指定多个键和键开始结束位置:

sort -n -k 3.8,3.12 -k 3.6,3.7 -k 3.4,3.5 < input_file

输出:

sltele     Hoodie   09081961 d04Hdq
sltele     Hoodie   07051987 d30Hdq
sltele     Hoodie   24051988 d12Hdq
sltele     Hoodie   20032000 d01Hdq
sltele     Hoodie   20042000 d14Hdq
sltele     Hoodie   13062002 d05Hdq
sltele     Hoodie   07082011 d08Hdq

从排序手册页:

KEYDEF 是 F[.C][OPTS][,F[.C][OPTS]] 表示开始和停止位置,其中 F 是字段编号,C 是字段中的字符位置;两者都是原点 1 ...字段中的字符从前一个空格的开头开始计算。

于 2012-07-20T04:42:22.600 回答
1

接受的答案实际上并没有回答对特定范围的绝对字符位置进行排序的问题,从行首开始计数(即位置 1,按 计数sort)。

重要的是要记住,对于sort,字段编号是指由字段分隔符分隔-t的文本部分,除非使用/--field-separator=SEP选项进行更改,否则这是一个非空白到空白的过渡。对从行首开始计数的绝对字符位置范围进行排序的正确方法是从字段号 1 开始计数字符,如下所示:

sort -k 1.STARTPOS,1.ENDPOS

1.ENDPOS如果您希望排序键延伸到行尾,您可以省略。

将字段编号与绝对字符位置混淆可能会导致令人惊讶(并且通常非常令人沮丧)的结果。

于 2015-04-25T17:33:05.777 回答
0

我知道有更好的方法可以做到这一点,但这是我过去所做的,很少需要对文件进行排序。

sed -e 's/\([0-9]\{2\}\)\([0-9]\{2\}\)\([0-9]\{4\}\)/\3\2\1/g' thisfile.txt | \
   sort -n -k 3,3 | \
   sed -e 's/\([0-9]\{4\}\)\([0-9]\{2\}\)\([0-9]\{2\}\)/\3\2\1/g' > sortedfile.txt
于 2012-07-20T04:24:16.020 回答