处理维度表中缺失值的最佳方法是什么?
在文本列的情况下,很容易写“NA: Missing”,但是对于保留特定值很重要的数字列应该怎么做。注意:我不想要使用带状值的解决方案(例如,“0-50”、“50-100”、“NA:缺失”的文本列)。
例如,客户维度可能有出生年份。错过出生年份应该如何处理?让它为空?添加任意数字作为占位符,例如 1900?
有时,可能很难找到占位符编号。例如,如果迄今为止的销售额为非负数,但可以为零,我不想将“0”作为 null 的占位符。我可以使用负值,例如“-1”,但这会破坏使用总和的查询。