我正在编写一个程序,它从 NumPy 数组(train_data)读取数据并使用 scikit-learn RandomForestClassifier 来预测另一个文件中的列的结果(测试)。我的所有代码都可以正常工作,除了我的代码末尾的 for 循环说从测试文件中获取行并将它们写入外部文件(打开),并带有一个额外的列 [0],其中 0 或 1 取决于数据不会运行。关于为什么的任何线索?这是相关代码
"""------------------Setting up the files-----------------------"""
testing = csv.reader(open('file_name', 'rb'))
header = testing.next()
opening = csv.writer(open('new_file_name', 'wb'))
"""------------------Setting up the files-----------------------"""
"""----------training and predicting--------------------"""
from sklearn.ensemble import RandomForestClassifier
Forest = RandomForestClassifier(n_estimators = 100)
Forest = Forest.fit(train_data[0::,1::],train_data[0::,0])
Output = Forest.predict(test_data)
"""----------training and predicting--------------------"""
"""------Writing new file-------------"""
final_count = 0
for row in testing:
row.insert(0,Output[final_count])
opening.writerow(row)
final_count += 1
"""------Writing new file-------------"""
我知道这是 for 循环,因为我在其中添加了一个额外的东西,如果 final_count 小于 5 并且它从未打印过,它将打印“Hello World”。这不是缩进错误,因为会出现这种情况,所以有人知道会发生什么吗?