我想通过以下方式转换文件:
输入:
LOC100132062,LOC100133331 0.37927964653622 0.434306394092769
ATAD3A,ATAD3B,ATAD3C 14.9379319811031 15.6244071876106 14.2514567745956
MMP23A,SLC35E2 1.23714660156378 0.99559795831378 1.47869524481378
.
.
.
首选输出:
LOC100132062,LOC100133331 0.37927964653622 0.434306394092769
LOC100132062,LOC100133331 0.37927964653622 0.434306394092769
ATAD3A,ATAD3B,ATAD3C 14.9379319811031 15.6244071876106 14.2514567745956
ATAD3A,ATAD3B,ATAD3C 14.9379319811031 15.6244071876106 14.2514567745956
ATAD3A,ATAD3B,ATAD3C 14.9379319811031 15.6244071876106 14.2514567745956
MMP23A,SLC35E2 1.23714660156378 0.99559795831378 1.47869524481378
MMP23A,SLC35E2 1.23714660156378 0.99559795831378 1.47869524481378
即对于每行中出现的每个字符串(此处为逗号),我想对其进行计数,然后将同一行复制相同的出现次数。所以在第一行有一个逗号,所以复制一次,在第二行有两个逗号,所以复制该行两次,等等。
理想情况下,第一列将是最初用逗号分隔的唯一字符串,但我对上面的内容也很满意!必须有一个简单的解决方案,但我似乎无法弄清楚。