假设您有一个如下所示的数据集:
Vietnam Gulf War Iraq War
veteran1 1 0 0
veteran2 0 1 0
veteran3 0 0 1
veteran4 0 1 1 # <---- Note this row
您希望合并这些列而不影响数据框中的其他列,如下所示:
Service
veteran1 1
veteran2 2
veteran3 3
veteran4 2 # <---- Note this row
在哪里
1 = Vietnam
,2 = Gulf War
,3 = Iraq War
- 如果一名老兵已经服务了 2 个或更多,它应该只选择一个(就像
veteran4
它选择最左边的列的情况一样) - 数据框中还有许多其他列,它们不应受到任何影响
问题:
你会怎么做R
呢?
(注意:如果在其他一些免费的开源程序中更容易做到,请随时分享哪个程序以及您将如何做到这一点。这是一个海量数据集:300 万行,美国社区调查。)