1

我正在尝试翻译以下 SQL 查询以在大型 pandas HDFStore 上运行:

SELECT * FROM mytable
JOIN (
  SELECT col1, col2, col3, max(colN) as maxColN
  FROM mytable
  GROUP BY col1, col2, col3
) m
ON m.col1=mytable.col1 AND m.col2=mytable.col2 AND m.col3=mytable.col3
WHERE colN=maxColN

实现这一点的最佳方法是什么?我在col1, col2,上有索引col3

4

0 回答 0