目前正在尝试编写代码来检查 7 GB 数据文件的数据质量。我试过谷歌搜索,但无济于事。最初,代码的目的是检查有多少是空值/NaN,然后将其与另一个数据文件连接并比较每个数据文件的质量。我们期望第二个更可靠,但我想稍后将整个过程自动化。我想知道这里是否有人愿意使用 Dask 分享他们的数据质量 python 代码。谢谢
问问题
26 次
目前正在尝试编写代码来检查 7 GB 数据文件的数据质量。我试过谷歌搜索,但无济于事。最初,代码的目的是检查有多少是空值/NaN,然后将其与另一个数据文件连接并比较每个数据文件的质量。我们期望第二个更可靠,但我想稍后将整个过程自动化。我想知道这里是否有人愿意使用 Dask 分享他们的数据质量 python 代码。谢谢