我在搞乱 awk 因为我认为用这个工具来处理制表符分隔或 csv 文件的标题要简单得多。
我有两种类型的文件(逗号或制表符分隔),我想做的就是将标题(NR = 1)修改为:
- 降低所有单词的大小写
- 用下划线替换每个字段名称的任何空格.. 例如。将以下癌症类型更改为 *cancer_type*
癌症类型、组装版本、染色体、染色体开始、染色体结束
到目前为止,我所做的只是列出第一行
awk 'NR == 1' test2.csv
好吧,我不知所措。无论如何,我可能会在进行一些下游修改之前运行这个脚本(sed 或 awk)。
任何帮助(或指向我一个好的教程/一个衬垫)将不胜感激。
编辑
嗨,我应该编辑以澄清这一点。我将从一个文件开始,并以相同的文件结束,但标题已更改。
我可以获得两个版本的文件。
CSV
癌症类型、组装版本、染色体、染色体开始、染色体结束
后:
癌症类型、装配版本、染色体、染色体开始、染色体结束
TSV
癌症类型\t 组装版本\t 染色体\t 染色体开始\t 染色体结束
后:
癌症类型\t 组装版本\t 染色体\t 染色体开始\t 染色体结束
话虽如此,我认为方法几乎奏效了..
编辑 2 操作系统是 OS X 10.7.+