我有一个包含 100 个案例的数据集。每个案例都有一个类 {I,II,III,IV,V} 和一个值 A 和 V,每个类在数据集中出现 20 次:
Class A V
5 2 3
1 3 5
3 2 3
2 3 5
3 2 3
1 2 4
1 2 4
1 4 4
2 3 3
2 3 4
我想根据这个集合再生成 100 个案例。我是否正确地假设我应该
- 找到每个班级的 A 分布和 V 分布?
- 计算每类 A & V 的联合分布
- 根据这个联合分布获得随机数
如果是这样,任何指向 java 或 python 中的应用程序或库的指针都会受到赞赏!