python - 将 2 个 csv 文件合并为一个用于多个文件

Question

我有 200 个文件，分为 2 个部分。例如。（aapl-BAL-Q.csv和aapl-CAS-Q.csv）我将它们与熊猫合并到aapl-ALL.csv中：

import pandas as pd
a = pd.read_csv('.../aapl-BAL-Q.csv')
b = pd.read_csv('.../aapl-CAS-Q.csv')
c = pd.concat([a,b], join='outer', axis=0, ignore_index=True, join_axes=None)
c.to_csv('...aapl-ALL.csv', index=False)

现在我需要为其余文件（例如aa-BAL-Q.csv和aa-CAS-Q.csv）等等..我想知道如何做最简单的方法，而不是重命名文件名代码，tnx。

score 1 · Accepted Answer

你可以：

将所有文件读入 pandas.Series 使用pathlib.Path('/path/to/data_dir').glob('*.csv')
按文件名的第一部分对该系列进行分组
读取属于每个组的所有 CSV 文件
- 连接它们
- 将连接的 DF 保存到 CSV 文件

from pathlib import Path

p = Path(r'/path/to/data/directory')

files = pd.Series([f.name for f in p.glob('*.csv')])

(files.groupby(files.str.split('-').str[0])
      .apply(lambda g: pd.concat([pd.read_csv(p / f) for f in g], ignore_index=True)
                         .to_csv(p / (g.name.split('-')[0] + '-ALL.csv'), index=False)))

python - 将 2 个 csv 文件合并为一个用于多个文件

1 回答 1

Related

Reference