我在 jupyter notebook 中对 pandas 进行了一些分析,由于我的 apply 函数需要很长时间,我希望看到一个进度条。通过这里的这篇文章,我找到了 tqdm 库,它为pandas 操作提供了一个简单的进度条。还有一个Jupyter 集成,它提供了一个非常好的进度条,进度条本身会随着时间而变化。
但是,我想将两者结合起来,但不太了解如何做到这一点。让我们以与文档中相同的示例为例
import pandas as pd
import numpy as np
from tqdm import tqdm
df = pd.DataFrame(np.random.randint(0, 100, (100000, 6)))
# Register `pandas.progress_apply` and `pandas.Series.map_apply` with `tqdm`
# (can use `tqdm_gui`, `tqdm_notebook`, optional kwargs, etc.)
tqdm.pandas(desc="my bar!")
# Now you can use `progress_apply` instead of `apply`
# and `progress_map` instead of `map`
df.progress_apply(lambda x: x**2)
# can also groupby:
# df.groupby(0).progress_apply(lambda x: x**2)
它甚至说“可以使用'tqdm_notebook'”但我没有找到方法。我尝试了一些事情,比如
tqdm_notebook(tqdm.pandas(desc="my bar!"))
或者
tqdm_notebook.pandas
但他们不工作。在定义中它看起来像
tqdm.pandas(tqdm_notebook(desc="my bar!"))
应该可以工作,但是该栏没有正确显示进度并且仍然有额外的输出。
还有其他想法吗?