我有大约 40 个维度的大约 50 万个条目的记录数组。维度是数据类型的混合。我想子选择 5 个布尔维度并获取大约 1k 个条目的块,然后计算协方差矩阵以查看维度相关性。我完全不知道如何使用.view()
或.astype()
进行这种转换。初始子选择:
p_new[['no_gender', 'no_age', 'no_income', 'no_politics', 'no_edu']]
array([(False, False, True, False, False), (True, True, False, True, True),
(True, True, False, True, True), ...,
(True, True, True, True, True), (True, True, True, True, True),
(True, True, True, True, True)],
dtype=[('no_gender', '|b1'), ('no_age', '|b1'), ('no_income', '|b1'), ('no_politics', '|b1'), ('no_edu', '|b1')])
我所有的转换尝试都将我的 5 个维度折叠为 1(不需要!),所以我最终(1000,5) dtype=np.bool
得到.(1000,5) dtype=np.int32
(1000,1) dtype=np.int32