我的 Stata 数据集包含对不同玩家在模拟中创建的产品组成组件的观察。我想只保留由不同且独特的组件组成的产品(由每个玩家创建),即识别在所有变量上不同的观察结果(按 player_id)。
数据是:
+---------+-----------+------------+------------+- ------------+ | 产品 | 玩家ID | 组件1 | 组件2 | 组件3 | +---------+-----------+------------+------------+- ------------+ | 1 | 1 | 1 | 2 | 3 | | 2 | 1 | 1 | 5 | 9 | | 3 | 1 | 7 | 8 | 9 | | 4 | 2 | 4 | 5 | 6 | | 5 | 2 | 4 | 5 | 9 | | 6 | 2 | 7 | 8 | 9 | +---------+-----------+------------+------------+- ------------+
理想的结果应该让我有以下结果:
+---------+-----------+------------+------------+- ------------+ | 产品 | 玩家ID | 组件1 | 组件2 | 组件3 | +---------+-----------+------------+------------+- ------------+ | 1 | 1 | 1 | 2 | 3 | | 3 | 1 | 7 | 8 | 9 | | 4 | 2 | 4 | 5 | 6 | | 6 | 2 | 7 | 8 | 9 | +---------+-----------+------------+------------+- ------------+
可以看出,产品 2 应该被删除,因为它与产品 1 有共同的组件 1,与产品 3 有共同的组件 3;同样,应该删除产品 5,因为它与产品 4 共享组件 1 和 2,而与产品 6 共享组件 3。
其余产品(按玩家)应保留,因为它们使用不同的非重叠组件。