我在不同的文件夹中有多个同名的标签文件,像这样
F:/RNASEQ2019/ballgown/abundance_est/RBRN02.sorted.bam\t_data.ctab
F:/RNASEQ2019/ballgown/abundance_est/RBRN151.sorted.bam\t_data.ctab
每个文件有 5-6 个公共列,我想选择两列——基因和 FPKM。基因列相同,只是 FPKM 值不同。我想从每个文件中提取 Gene 和 FPKM 列并制作一个像这样的主文件
Gene RBRN02 RBRN03 RBRN151
gene1 67 699 88
gene2 66 77 89
我做了这个
import os
path ="F:/RNASEQ2019/ballgown/abundance_est/"
files =[]
## r=root, d=directory , f=file
for r, d, f in os.walk(path):
for file in f:
if 't_data.ctab' in file:
files.append(os.path.join(r, file))
df=[]
for f in files:
df.append(pd.read_csv(f, sep="\t"))
但这并不是在进行侧面合并。我如何获得上述格式?请帮忙