我正在使用 scipy.stats.spearmanr 来计算 2 个序数变量的 Spearman 等级相关性。我不确定是否对它们进行编码。我两种方式都试过了,不管怎样,这个函数似乎都会吐出结果。所以我不确定该走哪条路。
from scipy import stats
# dummy data comparing one ordinal variable with another
print(stats.spearmanr(['always','never','sometimes','always'], ['high','medium','low','low']))
>> SpearmanrResult(correlation=0.5000000000000001, pvalue=0.4999999999999999)
# encoding
print(stats.spearmanr([3,1,2,3], [3,2,1,1]))
>> SpearmanrResult(correlation=0.05555555555555556, pvalue=0.9444444444444444)