给定一组文件——每个文件都被读入不同的文件——查询dataframe
如何pandasql
引用它们?
在以下代码段中,我们有 a list
of dataframes
: 但同样的问题也适用于 a dict
:
import pandas as pd
from pandasql import sqldf
# Read in a set of 10 files each containing columns `id` and `estimate`
dfs = [pd.read_csv('file%d.csv' %d) for d in range(1,10+1)]
sql_res = sqldf("select d2.estimate - d1.estimate \
from dfs[1] d1 join dfs[2] d2 on d2.id = d1.id", locals())
dfs[1]
和dfs[2]
正在显示我想做的事情- 但不是有效的语法。关于如何以可以支持的方式构建此类问题的任何建议pandasql
?