我是 Snowflake 的新手,并且运行查询以获取几天的数据 - 这将返回超过 2 亿行,并且需要几天时间。我尝试在 Jupyter 中运行相同的查询 - 并且内核在查询结束之前重新启动/死亡。即使它进入了 Jupyter——我怀疑我可以在任何合理的时间线上分析数据(但也许使用 dask?)。
我不确定从哪里开始——我正在尝试检查数据中的缺失值,我的第一直觉是使用 Jupyter——但我现在迷路了。
我的下一个想法是留在 Snowflake 中 - 并使用 case 语句检查那里的列(例如 sum(case when column_value = '' then 1 else 0 end) as number_missing_values
有没有人有任何想法/方向我可以尝试 - 或者知道我是否做错了什么?谢谢!