我有几个文件格式如下:
TCTCTGGAAAGGGACGCCTGGGGAGG 10 AAAAATACATTCTAACCTCGGCGT 1 TAATTTCATCAATATATCAATG 1 (ETC...)
我想删除空格后的所有内容,以便最后得到这个:
TCTCTGGAAAGGGACGCCTGGGGAGG AAAAATACATTCTAACCTCGGCGT TAATTTCATCAATATATCAATG (ETC...)
我该怎么做?
我有几个文件格式如下:
TCTCTGGAAAGGGACGCCTGGGGAGG 10 AAAAATACATTCTAACCTCGGCGT 1 TAATTTCATCAATATATCAATG 1 (ETC...)
我想删除空格后的所有内容,以便最后得到这个:
TCTCTGGAAAGGGACGCCTGGGGAGG AAAAATACATTCTAACCTCGGCGT TAATTTCATCAATATATCAATG (ETC...)
我该怎么做?
您可以使用 awk 执行此操作:
cat oldfile | awk '{print $1}' > newfile
cut -d' ' -f1 file.txt
或者:
sed 's/ .*//' file.txt
或者
sed -e 's/[^ACTG]//g' file.txt
或者
awk '{print $1}' file.txt
不像 timos 的回答那样简洁漂亮:),而是另一个使用 Ruby 编写的相同功能的快速示例。
#!/usr/bin/env ruby
data = File.read("data.txt")
f = File.open("outData.txt", "w")
finalData = data.scan(/^\w+/)
finalData.each {|i| f.write(i + "\n")}
f.close