我有一个包含 5,000 + 属性的数据集表格如下所示
id attr1 attr2, attr3
a 0 1 0
a 1 0 0
a 0 0 0
a 0 0 1
我希望在一行中表示每条记录,例如下表,以使其更适合通过聚类进行数据挖掘。
id, attr1, attr2, attr3
a 1 1 1
我尝试了多种方法来做到这一点,我尝试将其导入 MYSQL DB 并获取每个属性的最大值(每个 ID 只能为 1 或零),但表不能容纳 5,000 + 属性。
我已经尝试在 excel 中使用数据透视函数并获取每个属性的最大值,但是数据透视可以处理的列数远远少于我目前正在查看的 5,000。
我曾尝试将其导入 Tableua,但这也受到它无法处理这么多记录的影响
我只想在文本/CSV 文件或数据库表中获取表 2
任何人都可以提出任何建议,一个软件或我还没有考虑过的东西