我正在尝试用同一列中的值替换缺失值,这取决于它们与其他列的相等性:
我有不同的公司,来自不同的行业和国家,来自不同的年份。下面只是一个小例子。如果它们来自同一家公司,我想用列中的现有值替换缺失值(在列行业或国家/地区)。
例如,公司 123 在第 2 年缺少其行业。我有该公司前几年(或有时是以后)所属的行业,但不知道如何添加它。
另一个例子:我有公司 444,它在第 3 年缺少它的国家。我确实有前几年的国家,但不知道如何将其转移/复制到第 3 年:
--firm--year--industry--country
--123----1-------1---------usa
--123----2-------1---------usa
--123----3--------.--------usa
--333----1-------2---------usa
--333----2--------.---------usa
--444---1---------.----------fr
--444---2---------2---------fr
--444---3---------2----------.
我在 stata/help 和互联网上查找。我能找到的只是替换命令,但它只替换了相等的数字。
我认为这将是:
replace industry=(problaby something dependant of the firm (and maybe year)) if industry==.
replace country=(problaby something dependant of the firm (and maybe year)) if country==.
我不确定国家/地区的替代品,因为观察结果不是数字。我想我需要为国家替换生成一个带有数字的新变量。
非常感谢!