-1

我必须在 Stata 中使用svyset. 我对翻译我的调查结构的描述有点困惑。

在实践中,它是一种分层调查。被抽样的人口首先根据公司的活动部门(NOGA 2)进行细分,然后根据公司的规模(size)进行细分。完成了无需更换的 SRS。如果员工人数在 1-15 之间,则为 1;如果在 16-50 之间,则为 2;如果 > 50,则为 3。调查制作人给了我noga_2代码,size和一个名为的变量strata,它是从和的交集构建的noga_2size换句话说,对于两者的每个组合,它都有一个不同的值),

我不确定我是否必须使用

   svyset [pweight=gewibgrs], strata(stra_n)
   svyset nog_2 [pweight=gewibgrs], strata(stra_n)
   svyset nog_2 [pweight=gewibgrs] || size, strata(stra_n)

或其他...任何帮助将不胜感激 Ps 下面是采样方案的原始描述

Dans le cadre de la LSE, les entreprises suisses ont été réparties en strates selon la branche d'activité (classes NOGA 2), la taille (en fonction du nombre d'employés : de 3 à 19, de 20 à 49 et plus de 50)。Dans ces strates, un tirage aléatoire simple sans remise a été effectué, puis, dans chaque entreprise, des salaires ont été sélectionnés, à nouveau selon un tirage simple sans remise。

谢谢您的回答。如果我不是很清楚,我很抱歉。

lSE 是调查的名称。

据我从技术文档中了解到,给定数量的公司是从给定的层中随机选择的(没有替换)(由公司规模“大小”、活动部门“nog_2”和地区的交集给出)层的信息存储在变量 stra_n 中(stra_n 也可以通过结合 nog_2 和 size 来恢复)。

然后从所选公司中随机选择不同百分比的员工(公司的 id 也在数据集“brn_ree”中)。如果公司规模小,则选择所有员工,如果是中型,则选择大约 50% 的员工,如果是大公司,则选择大约 30% 的员工。

更复杂的情况是,对于某些地区,所有在该地区经营的公司都被选中。在这种情况下,如果我必须使用调查的区域版本,假设 stra_n 中的信息不相关是否正确?

我已经正确理解了您之前的回答对于完整的调查,我应该:

    svyset brn_ree [pweight = gewibgrs], strata(stra_n)

而对于区域性我应该有:

    svyset brn_ree [pweight = gewibgrs]

(也是因为如果我为区域调查编写第一个语句,则不会计算方差,因为它警告说只有一个分层观察可用)。

再次感谢你的帮助

4

1 回答 1

2

我删除了我原来的答案,因为它是基于错误的信息。

在这一点上,您的问题已经从有关 Stata 编码的特定问题扩展到取决于您的研究设计的详细信息和您的分析目标的问题。因此,我建议您将其指向Statalist。我这里只说你svyset解决单层分层问题的方法是不正确的。一个好的解决方案需要一个多步骤的方法,其中一部分可能因地区而异。

仍有不确定性。您将“strat_n”用作分层变量,您说可以通过组合扇区和大小来恢复。这个描述是错误的吗?如果不是,包含区域贡献的分层变量是什么?您指的是“地区版本的调查”;我认为您的意思是仅限于一个区域的分析。

在发布到 Statalist 之前,请确保您的帖子遵循常见问题解答指南 ( http://www.stata.com/support/faqs/resources/statalist-faq/ )。特别注意第三节。为了获得最好的帮助,不仅要描述抽样设计,还要描述分析的目标。

于 2013-10-19T03:47:21.023 回答