22

我试图重新组织包含以下内容的文件的格式:

>Humanl|chr16:86430087-86430726 | element 1 | positive
>Humanl|chr16:85620095-85621736 | element 2 | negative
>Humanl|chr16:80423343-80424652 | element 3 | negative
>Humanl|chr16:80372593-80373755 | element 4 | positive
>Humanl|chr16:79969907-79971297 | element 5 | negative
>Humanl|chr16:79949950-79951518 | element 6 | negative
>Humanl|chr16:79026563-79028162 | element 7 | negative
>Humanl|chr16:78933253-78934686 | element 9 | negative
>Humanl|chr16:78832182-78833595 | element 10 | negative

我的命令是:

awk '{FS="|";OFS="\t"} {print $1,$2,$3,$4,$5}'

这是输出:

>Human|chr16:86430087-86430726  |      element 1      |
>Human  chr16:85620095-85621736         element 2      negative
>Human  chr16:80423343-80424652         element 3      negative
>Human  chr16:80372593-80373755         element 4      positive
>Human  chr16:79969907-79971297         element 5      negative
>Human  chr16:79949950-79951518         element 6      negative
>Human  chr16:79026563-79028162         element 7      negative
>Human  chr16:78933253-78934686         element 9      negative
>Human  chr16:78832182-78833595         element 10     negative

除第一行外,每一行都可以正常工作。我不明白为什么会这样。

有人可以帮我吗?谢谢!

4

2 回答 2

38

简短的回答

FS并且OFS设置得太晚而无法影响第一行,请改用以下内容:

awk '{print $1,$2,$3,$4,$5}' FS='|' OFS='\t'

您也可以使用这个较短的版本:

awk -v FS='|' -v OFS='\t' '$1=$1'

长一点的答案

它不起作用,因为 awk 在设置FS和时已经执行了记录/字段拆分OFS$0您可以通过设置来强制重新拆分$0,例如:

awk '{FS="|";OFS="\t";$0=$0} {print $1,$2,$3,$4,$5}'

执行此操作的常规方法是 1.在子句中设置FS和其他,2. 通过符号设置它们,或 3. 在脚本之后将它们附加为. 我喜欢的风格是最后一种选择:BEGIN-v VAR=VALUEVAR=VALUE

awk '{print $1,$2,$3,$4,$5}' FS='|' OFS='\t'

-v请注意,设置脚本变量的时间和后脚本变量之间存在显着差异。-v将在子句之前设置变量,BEGIN而在子句之后设置变量的脚本设置BEGIN

于 2013-04-24T22:45:13.980 回答
18

尝试:

awk 'BEGIN{FS="|";OFS="\t"} {print $1,$2,$3,$4,$5}'
于 2013-04-24T22:30:50.553 回答