我有两个数据集,分别是测试和训练。我将它们收集在一个 csv 中。我想拆分我的数据以进行训练和测试。但它不应该是随机的。我需要拆分火车的前 808699 行,其余的行作为测试?
我试图阅读两个不同的 csv 但我不能。
from sklearn.model_selection import train_test_split
x_train,x_test,y_train,y_test=train_test_split(x,y,train_size=808698,test_size=121918,random_state=1)
ValueError: train_size=808698 should be either positive and smaller than the number of samples 121921 or a float in the (0, 1) range