1

我有几个文件格式如下:

TCTCTGGAAAGGGACGCCTGGGGAGG 10
AAAAATACATTCTAACCTCGGCGT 1
TAATTTCATCAATATATCAATG 1
(ETC...)

我想删除空格后的所有内容,以便最后得到这个:

TCTCTGGAAAGGGACGCCTGGGGAGG
AAAAATACATTCTAACCTCGGCGT
TAATTTCATCAATATATCAATG
(ETC...)

我该怎么做?

4

3 回答 3

2

您可以使用 awk 执行此操作:

cat oldfile | awk '{print $1}' > newfile
于 2012-06-24T19:26:04.093 回答
2
cut -d' ' -f1 file.txt

或者:

sed 's/ .*//' file.txt

或者

sed -e 's/[^ACTG]//g' file.txt

或者

awk '{print $1}' file.txt
于 2012-06-24T19:37:08.173 回答
0

不像 timos 的回答那样简洁漂亮:),而是另一个使用 Ruby 编写的相同功能的快速示例。

#!/usr/bin/env ruby

data = File.read("data.txt")
f = File.open("outData.txt", "w")
finalData = data.scan(/^\w+/)
finalData.each {|i| f.write(i + "\n")}
f.close
于 2012-06-24T19:41:15.537 回答