训练集由一组样本和一组标签组成,每个样本都有一个标签。在我的例子中,样本是向量,而标签是标量。为了解决这个问题,我使用 Numpy。考虑这个例子:
samples = np.array([[1,0],[0.2,0.5], [0.3,0.8]])
labels = np.array([1,0,0])
现在我必须将训练集分成两个分区,对元素进行洗牌。这个事实引发了一个问题:我失去了与标签的对应关系。我该如何解决这个问题?
由于性能在我的项目中至关重要,因此我不想构建置换向量,因此我正在寻找一种将标签与样本绑定的方法。现在我的解决方案是使用样本数组的最后一列作为标签,例如:
samples_and_labels = np.array([[1,0,0],[0.2,0.5,0], [0.3,0.8,1]])
这是我的情况下最快的解决方案吗?或者有没有更好的?例如创建对?