0

我有 2 个 csv 文件,其中一个由 1 列和 27 行(仅包含数字)组成,我想逐行比较这 2 个 csv 文件,取均方误差并打印每次比较的结果,这样我就可以计算平均值最后的均方误差。我正在使用 pandas 和 sklearn 任何帮助都非常感谢。先感谢您。

import pandas as pd
from sklearn.metrics import mean_squared_error
cars = pd.read_csv('koula.csv')
moto = pd.read_csv('katerina.csv')
print(cars)
print(moto)
for i in range(cars):
    for j in range(moto):
       print(mean_squared_error(cars,moto))
4

1 回答 1

1

如果您只想计算每一行中的一个值,您应该这样做:

for i in range(len(cars)):
   print(mean_squared_error(cars[i],moto[i]))

如果您的数据集具有相同的长度,则此方法有效。

但是,如果您尝试计算数据集中所有行的错误,请使用:

print(mean_squared_error(cars.values, moto.values))

这将做与上面相同的事情,但它采用所有值的平均值,这将更有用。

最后,如果它们是pd.Series您不必使用的实例类.values

于 2020-07-01T23:44:26.893 回答