1

我有一个大文件,其中有许多可变长度的方括号中的数字列表实例,每行最多一个列表,列表永远不会为空,例如:

[1, 45, 54, 78] 或 [32]

我想去掉方括号和逗号,例如:

1 45 54 78 或 32

我可以成功地将它们与 sed 中的这个正则表达式匹配:

\\[\\([0-9]*\\)\\(, \\([0-9]*\\)\\)*\\]

但我不知道如何使用组号来指代我想要的组,例如:

sed  's/\\t\[\\([0-9]*\\)\\(, \\([0-9]*\\)\\)*\\]/\\t\\1 \\3/g'

只会导致目标文件获得列表中的第一个和最后一个数字。

(我确实使用 awk 解决了我的问题,但我想知道是否可以使用 sed 来完成)

有没有办法在 sed 中引用可变数量的组?

4

3 回答 3

2

怎么样:

sed 's/\[([\d ,]+)\]/\1/g' | sed 's/,//g'

两个单独的命令 - 第一个提取“方括号内的内容”,第二个去除逗号。

于 2013-12-30T20:01:20.600 回答
1

awk应该这样做:

awk '{gsub(/[][,]/,x)}1' file
1 45 54 78 or 32
于 2013-12-30T20:07:23.283 回答
1

这可能对您有用(GNU sed):

sed -r ':a;/\[([0-9]+(, )*)+\]/!b;s//\n&\n/;h;s/[][,]//g;G;s/.*\n(.*)\n.*\n(.*)\n.*\n/\2\1/;ba' file

这会找到模式,在两边用换行符标记它,并将整行复制到保留空间。然后它删除模式中的括号和逗号,并将更改的模式与原始模式重新组合,然后重复直到找不到更多模式。

于 2013-12-30T22:05:38.483 回答