0

示例 dask 数据框:

import pandas as pd
import dask
import dask.dataframe as dd

df = pd.DataFrame({'col_1': [1,2,3,4,5,6,7], 'col_2': list('abcdefg')}, 
                  index=pd.Index([0,0,1,2,3,4,5]))
df = dd.from_pandas(df, npartitions=2)

现在我只想得到第一个(基于索引)结果 - 就像在熊猫中一样:

df.loc[df.col_1 >3].iloc[0]
   col_1 col_2
2      4     d

我知道在 dask using 中没有位置行索引iloc,但我想知道是否可以像 SQL 那样将查询限制为 1 个结果

4

1 回答 1

0

明白了 - 但不确定这里的效率:

tmp = df.loc[df.col_1 >3] 
tmp.loc[tmp.index == tmp.index.min().compute()].compute() 
于 2020-11-25T16:20:10.073 回答