import pandas as pd
from pandasql import sqldf
pysqldf=lambda query:sqldf(query=query,env=globals())
df=pd.read_csv('https://s3.amazonaws.com/content.udacity-data.com/courses/ud359/weather_underground.csv')
query="SELECT fog,maxtempi from df GROUP BY fog"
print(pysqldf(query))
输出
fog maxtempi
0 0 86
1 1 81
在这一点上,我知道该表被分组为雾组,分为 2 个类别,但我不明白为什么 maxtempi 会获得这些值,因为我没有明确指定返回最高温度。