我正在尝试分析调查的回复。结果变量名为“reading_proficiency”,具有两个值 0 和 1。数据集有 3,539 个观察值,因此“reading_proficiency”列有 0 或 1 的 3,539 个观察值。
我想了解我是否可以在这里使用二项分布的想法。变量“reading_proficiency”可以是随机变量吗?
我使用的随机变量的定义如下。随机变量是随机决定的具有不同值的变量。换句话说,它是一个随机变化的数值。
“reading_proficiency”的值真的是偶然决定的吗?对“reading_proficiency”的两个观察真的相互独立吗?
如果两个观察来自同一个调查集群,他们可能就读于同一所学校,由同一位教师教授,因此具有相同的“reading_proficiency”。
许多观察来自同一个集群的事实是否会取消“reading_proficiency”作为随机变量的资格?
我在读到“reading_proficency”的每个观察都应该是相互独立的,但调查数据并非如此,或者......?
这是否意味着调查数据不能是随机变量?