我必须在 Stata 中使用svyset
. 我对翻译我的调查结构的描述有点困惑。
在实践中,它是一种分层调查。被抽样的人口首先根据公司的活动部门(NOGA 2)进行细分,然后根据公司的规模(size
)进行细分。完成了无需更换的 SRS。如果员工人数在 1-15 之间,则为 1;如果在 16-50 之间,则为 2;如果 > 50,则为 3。调查制作人给了我noga_2
代码,size
和一个名为的变量strata
,它是从和的交集构建的noga_2
(size
换句话说,对于两者的每个组合,它都有一个不同的值),
我不确定我是否必须使用
svyset [pweight=gewibgrs], strata(stra_n)
svyset nog_2 [pweight=gewibgrs], strata(stra_n)
svyset nog_2 [pweight=gewibgrs] || size, strata(stra_n)
或其他...任何帮助将不胜感激 Ps 下面是采样方案的原始描述
Dans le cadre de la LSE, les entreprises suisses ont été réparties en strates selon la branche d'activité (classes NOGA 2), la taille (en fonction du nombre d'employés : de 3 à 19, de 20 à 49 et plus de 50)。Dans ces strates, un tirage aléatoire simple sans remise a été effectué, puis, dans chaque entreprise, des salaires ont été sélectionnés, à nouveau selon un tirage simple sans remise。
谢谢您的回答。如果我不是很清楚,我很抱歉。
lSE 是调查的名称。
据我从技术文档中了解到,给定数量的公司是从给定的层中随机选择的(没有替换)(由公司规模“大小”、活动部门“nog_2”和地区的交集给出)层的信息存储在变量 stra_n 中(stra_n 也可以通过结合 nog_2 和 size 来恢复)。
然后从所选公司中随机选择不同百分比的员工(公司的 id 也在数据集“brn_ree”中)。如果公司规模小,则选择所有员工,如果是中型,则选择大约 50% 的员工,如果是大公司,则选择大约 30% 的员工。
更复杂的情况是,对于某些地区,所有在该地区经营的公司都被选中。在这种情况下,如果我必须使用调查的区域版本,假设 stra_n 中的信息不相关是否正确?
我已经正确理解了您之前的回答对于完整的调查,我应该:
svyset brn_ree [pweight = gewibgrs], strata(stra_n)
而对于区域性我应该有:
svyset brn_ree [pweight = gewibgrs]
(也是因为如果我为区域调查编写第一个语句,则不会计算方差,因为它警告说只有一个分层观察可用)。
再次感谢你的帮助