我正在尝试使用 Pandas 读取一个相当大的 CSV 文件并将其分成两个随机块,其中一个是 10% 的数据,另一个是 90%。
这是我目前的尝试:
rows = data.index
row_count = len(rows)
random.shuffle(list(rows))
data.reindex(rows)
training_data = data[row_count // 10:]
testing_data = data[:row_count // 10]
出于某种原因,sklearn
当我尝试在 SVM 分类器中使用这些生成的 DataFrame 对象之一时,会引发此错误:
IndexError: each subindex must be either a slice, an integer, Ellipsis, or newaxis
我想我做错了。有一个更好的方法吗?