现在我正在创建一个程序,它将 csv 文件组合成一个不重复的类似列。创建的列需要添加到相邻列的旁边。
截至目前,我能够获取文件,但我无法确定一种方法来开发一种方法来迭代每个读取的 csv 数据帧,然后将所有这些数据帧合并在一起并推出一个 csv 文件。现在我正在使用三个带有公共 ID 列的 csv 文件对此进行测试我现在拥有的内容如下:
os.chdir(filedname)
data = pd.merge([pd.DataFrame.from_csv(file) for
file in glob.glob("*.csv")],on='ID')
data.to_csv('merged.csv')
文件如下所示:
(File 1) (File 2)
ID BLA ID X
1 2 1 55
2 3 2 2
3 4 3 12
4 5 4 52
并且目录中每个 csv 文件中除了 ID 列之外的每个不同列应该相互合并以创建一个 csv 文件,如下所示:
ID BLA X
1 2 55
2 3 2
3 4 12
4 5 52
任何建议都可以帮助我解决这个问题。