以下是美国消费者支出调查(2011 年)第 2 页码本中两个样本变量的格式。62.
VARIABLE_NAME VARIABLE_DESCRIPTION Format Note
FEDRFNDX During the past 12 months, what was the total amount of refund received from Federal income tax by ALL CU members?
NUM(8)
FEDTAXX During the past 12 months, what was the total amount PAID for Federal income tax, in addition to that
withheld from earnings, by ALL CU members?
NUM(8)
其中 CU 表示消费者单位(或家庭)。Stata 数据文件显示 FEDRFNDX 和 FEDTAXX 变量的以下格式:
FEDRFNDX int %8.0g
FEDTAXX long %12.0g
我的问题是为什么这些变量的 Stata 格式不同,尽管它们在码本中都是 NUM(8) 并且都引用了 amount 。作为调查数据的最终用户,我们如何确定我们有正确的格式(例如,如果我们只是给定了上面的码本,比如 NUM(8) 和变量的起始位置加上 ascii 数据而不是统计数据)?
如果这个问题过于本地化,我深表歉意。