有谁知道如何将 shell 命令的输出(一系列 csvkit 工具调用)流式传输到 jupyter 笔记本单元格,但特别是流式传输到 Pandas DataFrame。从单元格的内容来看,它看起来像这样:
output = !find /path -name "*.csv" | csvstack ... | csvgrep ...
df = DataFrame.read_csv(output)
只有上述不是真正的工作。shell 的输出是非常大的数百万行,Pandas 可以处理得很好,但我不希望输出作为字符串完整地加载到内存中。
我正在寻找一种允许 Pandas 读取输出的管道/流式传输解决方案。