假设我们有一些具有以下变量的人口普查数据:
性别、婚姻状况、教育程度、种族、职业、收入
除了收入是连续变量之外,每个变量都是分类变量。
上述 5 个分类变量为 5 个维度,第一个目标是找出这 5 个维度中的哪些段的人口规模最大?例如,细分 [男性、未婚、大学、西班牙裔、IT] 的人口规模最大。
下一个目标是找出 5 个维度中哪个部分的收入总和最高。
对于一维,直方图将起作用;二维,二维直方图也可以;3维,可能是数据立方体?但是我对3+维度一无所知,有人可以解释一下吗?
假设我们有一些具有以下变量的人口普查数据:
性别、婚姻状况、教育程度、种族、职业、收入
除了收入是连续变量之外,每个变量都是分类变量。
上述 5 个分类变量为 5 个维度,第一个目标是找出这 5 个维度中的哪些段的人口规模最大?例如,细分 [男性、未婚、大学、西班牙裔、IT] 的人口规模最大。
下一个目标是找出 5 个维度中哪个部分的收入总和最高。
对于一维,直方图将起作用;二维,二维直方图也可以;3维,可能是数据立方体?但是我对3+维度一无所知,有人可以解释一下吗?