0

我在学术研究项目的背景下使用 IBM Watson Personality Insights。

从目前的分析来看,我注意到相同推文的原始分数和百分位数之间通常存在很大差异,并且在某些情况下,分数甚至处于相反的两端(例如,宜人性原始得分:0.21 和宜人性百分位数得分 0.76)。此外,在我的样本人群的总体水平上,百分位数分数的人格特征方差要高得多,而原始分数的方差则非常低(所有观察值都在每个特征的 0.1-0.2 范围内)。

我知道百分位数是标准化分数,对分数的解释是不同的。我的问题是,旨在将它们应用于回归分析(例如,个人的人格特征 - 成功)的研究人员通常使用哪个分数?在我看到的应用 Personality Insights 的论文中,作者没有讨论他们使用哪个分数。如果您对此有一些想法,并且可以分享任何更详细地讨论他们与 Personality Insights 的方法的研究,那就太好了。

非常感谢您的指导!

4

1 回答 1

1

你是对的,分数有不同的解释。原始分数正是如此,因为归一化分数在更大的人群中。虽然一个特征的原始分数的范围是从 0 到 1,但实际上情况并非总是如此,分数可能集中在一个较窄的范围内。这就是为什么在上面显示的示例中,原始分数的微小变化可能会对百分位分数产生更大的变化。

请注意,为了计算百分位数,我们为更大的人口 (100Ks) 运行了配置文件,您将观察到这些趋势可能不会在较小的样本中显示。

至于你的其他问题;你会使用哪个分数取决于。一般来说,大多数人使用百分位分数,因为它可以让您了解特定人群与整个人群的比较情况。例如,如果我有兴趣了解一组与另一组的比较,使用百分位分数可以更容易直观地理解差异(25% 的宜人性差异比 0.1 的原始差异更容易理解因为你不知道这是否重要)。另一方面,原始分数主要在您创建更大的模型并将 PI 分数用作特征之一时使用。在这种情况下,使用原始分数通常会有所帮助,因为您可以从更大的模型中得出自己的结论。

于 2018-09-07T14:02:47.517 回答