1

我的 DF 分为测试和训练大小:

testSampleSize = 2573.0 
trainingSampleSize = 7719.0

我计算测试样本的行,使用:

rows = random.sample(df.index, int(testSampleSize)) 

df 是我的数据框。

为了获得我使用的测试数据:

df_test = bothDF.ix[rows]

然而,这个 df_test 的长度是 2604,而不是 testSampleSize。

现在我从训练数据的初始 DF 中删除这些行:

df_training = bothDF.drop(rows)

此 df_training 的长度为 7698。

为什么长度与创建的样本大小不同?

4

0 回答 0