我有一个制表符分隔的文件,看起来像这样。
"""chr1" "38045559" "38046059" "C1orf122"""
"""" "" "" "C1orf122"""
"""" "" "" "YRDC"""
"""chr1" "205291045" "205291545" "YOD1"""
"""chr1" "1499717" "1500625" "SSU72"""
从此命令将 .csv 转换为制表符分隔文件后,我得到了此文件
perl -lpe 's/"/""/g; s/^|$/"/g; s/","/\t/g' <test.csv>test_tab
现在,我希望我的文件保持制表符分隔,但应从文件中删除所有额外的引号。但同时当我打印第 4 列时,我应该得到所有名称和第 1,2 列和第 3 列的坐标(我仍然得到它,但带有引号)。
我应该在上面的命令中做什么操作,请指导。
所需的输出是(因为我被要求清楚)
chr1 38045559 38046059 C1orf122
C1orf122
YRDC
chr1 205291045 205291545 YOD1
chr1 1499717 1500625 SSU72
这样当我提取第 4 列时,我应该得到
C1orf122
C1orf122
YRDC
YOD1
SSU72
谢谢