我的 DF 分为测试和训练大小:
testSampleSize = 2573.0
trainingSampleSize = 7719.0
我计算测试样本的行,使用:
rows = random.sample(df.index, int(testSampleSize))
df 是我的数据框。
为了获得我使用的测试数据:
df_test = bothDF.ix[rows]
然而,这个 df_test 的长度是 2604,而不是 testSampleSize。
现在我从训练数据的初始 DF 中删除这些行:
df_training = bothDF.drop(rows)
此 df_training 的长度为 7698。
为什么长度与创建的样本大小不同?