嗨,我有一些从 csv 读取的数据,这些数据以二进制形式列出:
1 2 3 4...N
1 0 1 0 1...1
2 1 1 0 1...1
3 0 0 0 0...0
4 1 0 1 1...1
. 1 1 1 0...1
. 1 0 0 0...1
N 0 0 1 1...0
我想获取这些数据的一个子集,其中行向量的总和大于一个数字,比如 10 或 x。第一列是客户 ID 的占位符列,因此需要排除。你对我如何去做这件事有什么建议吗?
我一直在尝试各种各样的事情,df=subset()
但我无法让语法正确。
提前致谢。