0

我有两组李克特数据,范围从 0 到 100,其中 0 表示非常不同意,100 表示非常同意。第一组包含来自 500 个用户样本的答案。第二组还包括来自同一样本的 500 个用户的数字答案。这些数据集以这种方式相关:在 i = 1 的情况下,第一组中的第 i 个用户在特定游戏平台(例如:playstation 网络上的一方)的许多场合中与第二个数据中的第 i 个用户匹配。 .,500. 向用户提出的问题是:你喜欢狗吗?以下是数据外观的示例:

user_1_data = [100,60,98, 50,0,...,20,100]
user_2_data = [50,75,12,...,100,20]

其中 user_1_data[0] 是与 user_2_data[0] 匹配的用户,他们对问题 Do you like dogs 的回答分别为 100 和 50?依此类推,直到 i = 500。我设法在下面的概率分布中绘制了实际数据。其中 x 轴是从 0 到 100 的评分,y 轴是选择该特定评分的概率。 用户 1 和 2 数据

尽管分布看起来很相似,但我需要某种测试来证明它们之间的某种意义(如果有的话)。最后我想回答这个问题:相似的答案分布是否意味着用户将在不同的场合一起玩?

请随时编辑此问题以进行格式化并更易于理解。

这是一个统计问题。如果可能,请使用统计术语和数学语言。我是数据科学的新手,很想学习如何在未来回答我自己的问题。

我用python编码。

4

0 回答 0