问题标签 [likert]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - python中李克特数据的统计分析
我有两组李克特数据,范围从 0 到 100,其中 0 表示非常不同意,100 表示非常同意。第一组包含来自 500 个用户样本的答案。第二组还包括来自同一样本的 500 个用户的数字答案。这些数据集以这种方式相关:在 i = 1 的情况下,第一组中的第 i 个用户在特定游戏平台(例如:playstation 网络上的一方)的许多场合中与第二个数据中的第 i 个用户匹配。 .,500. 向用户提出的问题是:你喜欢狗吗?以下是数据外观的示例:
其中 user_1_data[0] 是与 user_2_data[0] 匹配的用户,他们对问题 Do you like dogs 的回答分别为 100 和 50?依此类推,直到 i = 500。我设法在下面的概率分布中绘制了实际数据。其中 x 轴是从 0 到 100 的评分,y 轴是选择该特定评分的概率。
尽管分布看起来很相似,但我需要某种测试来证明它们之间的某种意义(如果有的话)。最后我想回答这个问题:相似的答案分布是否意味着用户将在不同的场合一起玩?
请随时编辑此问题以进行格式化并更易于理解。
这是一个统计问题。如果可能,请使用统计术语和数学语言。我是数据科学的新手,很想学习如何在未来回答我自己的问题。
我用python编码。
r - 如何使用 R 中的 likert 库按类别(维度)进行汇总
我正在尝试进行问题分析,但使用维度,例如:
维度 1
- 问题 1(p1):
- 问题 2(p2):
- 问题 3(p3):
维度 2
- 问题 4(p4):
- 问题 5(p5):
- 问题 6(p6):
- 问题 7(p7):
现在我想做一个总结,但是按维度来说,likert 库中是否有此功能?
例如
r - 使用 likert() 时分组汇总结果出错
我正在尝试可视化一些李克特数据。我已经成功地使用 likert() 在所有受访者中做到了这一点
为了按组切割,我使用了以下代码(有效):
但是,当我对这些结果进行总结以绘制时:
它似乎重复了“组”,当我尝试绘制时,我收到以下错误消息:
不知道为什么会这样 - 任何帮助将不胜感激
r - 清理李克特量表数据:除了一些不相关的字符串,如何测试数据是否连续?
我需要清理使用李克特量表收集的数据。这意味着我的数据中的观察结果来自从序数尺度中选择一个选项的人,例如“在 1-5 的尺度上,其中 1 表示糟糕,5 表示美妙,你如何评价你对茄子的喜爱程度? ”
因此,一个典型的数据集看起来像
我的任务是测试数据是否确实是likert scale,这意味着(1)值是整数,(2)如果我们总结唯一值,它们是连续的。
- 测试是否都是整数可以通过
- 测试唯一值是否是连续的[实际上我不知道该怎么做,但我的问题并没有到此结束]。
我真正的问题是,李克特量表可能有不同的变化,并且其他字符串可能会显示在数据中,从而增加噪音。
有效的李克特量表可以跨越不同的范围,例如 1-5、0-3 或 1-10 等。
很多时候会有额外的字符串,比如“无关”、“我不知道”、“我不这么认为”、“不适用于我”等等。我无法预料数据中会出现哪些额外的字符串(如果有的话)。
在这种情况下,我需要检测我的数据是否本质上可能来自“李克特量表”。
决定数据的标准是李克特量表:
- 数值是整数。
- 当我们采用唯一值时,它们是连续的(在 return 的意义上。如果它已经返回
sort(unique(df_a$response))
,那么它将不符合“连续性”标准)1 2 3 4 5
1 3 4 5
- 范围内的最小值是
0
或者1
- 最大值为
10
。 - 非数字的噪声字符串(例如“我不知道”、“abcd34”、“不相关”)占数据的不到 50%
下面是 4 个示例来演示可能的数据类型以及在测试它们是否“likert”时我期望发生的情况 在
我用来模拟“噪声”字符串的示例stringi::stri_rand_strings
中(例如,“我不知道”、“无关”以及我上面给出的其他示例)
示例 1 - 测试“islikert scale”应该返回TRUE
示例 2 —— 测试“islikert scale”应该返回FALSE
以下数据中,数字不连续
示例 3——测试“islikert scale”应该返回FALSE
在以下数据中,“附加字符串”占数据的50%以上,数据的核心不太可能是李克特量表
示例 4——测试“islikert scale”应该返回FALSE
只是随机数和字符串,没有理由相信这是一个李克特量表,即使它碰巧是唯一且连续的,但 1 -> 30 根本不可能是李克特量表。
我在问什么
我认为一个完整的解决方案会很长,所以向这里的人询问可能太多了。因此,即使只是提示、一般方法或解决此问题的想法,我也会很高兴。
r - 使用李克特图分组
我试图使用 likert 包绘制按响应时间分组的百分比。我在两个时间点对 17 个项目(列)有 120 个响应(行)。df 有 240 行 * 18 列
我想收到两个包装在一起的图:一个用于第一个时间点(TP=1)的所有项目(17),另一个用于第二个时间点(TP=2)的所有项目(17)
但是,使用分组功能我只能收到按时间分组的 17 个图,我该如何更改它?
这是前 5 个项目的图: 在此处输入图像描述 lboth_small <- likert(both_small[, c(1:5)], grouping = both_small$TP ) plot(lboth_small)
encoding - 调查数据的预处理
我有一个数据集,我想构建一个机器学习模型。该数据集由调查问题组成,参与者将问题评为无用、有点有用、有用、非常有用等。
我将特征编码为序数(没用:1,有点用:2,有用:3,非常有用:4)除了这些类型的数据,我还有连续和二进制特征。我用 Standard Scaler 对连续数据进行了缩放,并没有触及二进制数据。但是,我不确定是否要缩放这个序数编码特征。我应该同时缩放它们还是保持原样?