我使用 Pandas 作为数据库替代品,因为我有多个数据库(Oracle、SQL Server等),并且我无法将命令序列转换为 SQL 等价物。
我在 DataFrame 中加载了一个表,其中包含一些列:
YEARMONTH, CLIENTCODE, SIZE, etc., etc.
在 SQL 中,计算每年不同客户的数量是:
SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;
结果将是
201301 5000
201302 13245
我怎样才能在熊猫中做到这一点?