0

假设我们有一些具有以下变量的人口普查数据:

性别、婚姻状况、教育程度、种族、职业、收入

除了收入是连续变量之外,每个变量都是分类变量。

上述 5 个分类变量为 5 个维度,第一个目标是找出这 5 个维度中的哪些段的人口规模最大?例如,细分 [男性、未婚、大学、西班牙裔、IT] 的人口规模最大。

下一个目标是找出 5 个维度中哪个部分的收入总和最高。

对于一维,直方图将起作用;二维,二维直方图也可以;3维,可能是数据立方体?但是我对3+维度一无所知,有人可以解释一下吗?

4

0 回答 0