我正在绘制来自不同学校的学生数据,以查看某些专业的男女学生人数之间的差异。我正在使用 python,我已经绘制了一些学校的数据,并且正如我预期的那样,男性人数确实更高,然后我意识到每所学校的学生总数都不同。当样本量不同时,我的工作是否有意义?如果不是,我可以建议进行一些更改。
问问题
465 次
2 回答
0
这个问题不是关于编程的,而是关于统计的,但我会尽力回答。
重要的问题,我没有到达那里:你这样做是为了什么?如果您问“嗯……人口中男性多于女性(在这种情况下,人口 = 主要项目中的所有人)”之类的问题?. 因此,每所学校对您来说并不重要,您可以像处理一所学校一样处理样本(但不要伪造收集它们)。
但是你可能会问:“样本学校之间有什么区别吗?”。在这种情况下,收集是不正确的。为此,我强烈推荐stucked=True
每所学校使用 barh plot。对于标准化,只需使用百分比。样本大小之间的差异不会有问题。
PLS,如果您提出问题,请输入一些代码。样本中的 3 行和 1 个图将非常有帮助...
于 2020-07-26T11:21:40.723 回答
0
现在我意识到了。
看:你有两个班级,第一个有 2 个人,第二个有 20 个男人。还有他们的标记。2 名男子 - 两人都是 90/100。第二个20分。假设它是从 40 到 80 的范围。如果我们说“嗯,第一堂课的测试比第二堂课好得多”是否正确?Ofc,不是。
要解决这个问题,只需一个min(sizes of samples)
. 如果它看起来太小,那么扔掉这个程序,因为你没有足够的数据来说明什么。并通过代理图例或文本放置样本的总大小,或将其添加到标题中。无论如何,它将向您显示结果的可靠性。
于 2020-07-26T12:15:19.163 回答