0

我正在尝试在不存在的行中添加一个“chr”字符串。此操作仅在没有'##' 的行中是必需的。起初我使用 grep + sed 命令,如下所示,但我想运行覆盖原始文件的命令。

grep -v "^#" 5b110660bf55f80059c0ef52.vcf | grep -v 'chr' | sed 's/^/chr/g'

因此,要在文件中运行命令,我会这样写:

sed -i -E '/^#.*$|^chr.*$/ s/^/chr/' 5b110660bf55f80059c0ef52.vcf

这是 vcf 文件的内容。

##FORMAT=<ID=DP4,Number=4,Type=Integer,Description="#ref plus strand,#ref minus strand, #alt plus strand, #alt minus strand">
#CHROM  POS ID  REF ALT QUAL    FILTER  INFO    FORMAT  24430-0009S21_GM17-12140
1   955597  95692   G   T   1382    PASS    VARTYPE=1;BGN=0.00134309;ARL=150;DER=53;DEA=55;QR=40;QA=39;PBP=1091;PBM=300;TYPE=SNP;DBXREF=dbSNP:rs115173026,g1000:0.2825,esp5400:0.2755,ExAC:0.2290,clinvar:rs115173026,CLNSIG:2,CLNREVSTAT:mult,CLNSIGLAB:Benign;SGVEP=AGRN|+|NM_198576|1|c.45G>T|p.:(p.Pro15Pro)|synonymous GT:DP:AD:DP4    0/1:125:64,61:50,14,48,13
chr1    957898  82729935    G   T   1214    off_target  VARTYPE=1;BGN=0.00113362;ARL=149;DER=50;DEA=55;QR=38;QA=40;PBP=245;PBM=978;NVF=0.53;TYPE=SNP;DBXREF=dbSNP:rs2799064,g1000:0.3285;SGVEP=AGRN|+|NM_198576|2|c.463+56G>T|.|intronic    GT:DP:AD:DP4    0/1:98:47,51:9,38,10,41
4

3 回答 3

1

如果我了解您的预期结果,请尝试:

sed -ri '/^(#|chr)/! s/^/chr/' file
于 2018-06-01T14:56:47.377 回答
0

您的问题不清楚,并且您没有提供预期的输出,因此我们无法测试潜在的解决方案,但如果您想要的只是添加chr到它不存在且不以#then开头的行的开头那只是:

awk '!/^(#|chr)/{$0="chr" $0} 1' file

使用 GNU awk 覆盖原始文件将是:

awk -i inplace '!/^(#|chr)/{$0="chr" $0} 1' file

并使用任何 awk:

awk '!/^(#|chr)/{$0="chr" $0} 1' file > tmp && mv tmp file
于 2018-06-01T14:55:49.627 回答
0

这可以通过一次sed调用来完成。脚本本身类似于以下内容。

如果您输入格式

$ echo -e '#\n#\n123chr456\n789chr123\nabc'
#
#
123chr456
789chr123
abc

然后将 chr 添加到未注释的 chrless 行中,如下所示

$ echo -e '#\n#\n123chr456\n789chr123\nabc' | sed '/^#/ {p
d
}
/chr/ {p
d
}
s/^/chr/'

哪个打印

#
#
123chr456
789chr123
chrabc

(注意多行sed脚本。)

现在您只需要在文件上就地运行此脚本(-i在现代sed版本中。)

于 2018-06-01T14:27:04.417 回答