我正在阅读文档以了解确定系数,从文档中我了解到确定系数不过是 R x R(相关系数)
所以我从 kaggle.com 获取房价数据集并开始尝试以更好地理解,这是我的代码
取相关系数
test_data=pd.read_csv(r'\house_price\test.csv')
_d=test_data.loc[:,['MSSubClass','LotFrontage']]
_d.fillna(0,inplace=True)
_d.corr()
现在,像这样取确定系数
from sklearn.metrics import r2_score
r2_score(_d['MSSubClass'],_d['LotFrontage'])
为此,我得到了值-0.9413195412943647
理想情况下不应该是0.060531252961吗?如-0.246031 x -0.246031 = 0.060531252961