将 csv 加载到 Deedle 数据结构中时,是否可以指定自定义值来表示 null 或 NaN?在 Python pandas 中,这是一个可配置的列表选项。
通常来自 csv 的输入数据将包含一些任意值来表示 null,而列的其余部分确实具有有效值(双精度类型)。目前我必须将它们全部加载,然后将函数应用于列以尝试解析双精度。
谢谢卡比
目前不支持此功能,但我同意这将非常有用!我创建了一个GitHub 问题来跟踪它。
我们肯定会在某个时候添加它,但是如果您想贡献并添加对指定自定义缺失值的支持,这实际上很容易。Deedle 使用来自 F# Data 的 CSV 解析器,它已经支持此功能,因此您实际上只需要添加一个额外的可选参数,而不是在源代码(和其他重载)中使用默认的缺失值。(并添加一些测试以确保我们不会破坏它:-))
贡献绝对很棒!