我有一个数据集,想在一端删除 1% 的数据。例如,我有 3000 个观察值,我想删除 30 个最高的观察值。有这种修剪的命令吗?顺便说一句,我是Stata的新手。
问问题
11284 次
3 回答
1
如果你知道你的 drop 的截止值是多少,你可以使用:
drop if var1>300
删除所有var1
超过 300 的行。
您可以使用summarize var1, detail
获取关键百分位数:它将为您提供 1% 和 99% 的百分位数以及其他标准百分位数。
于 2013-08-05T14:09:09.753 回答
1
您可以_pctile
在 Stata 中使用它。
sysuse auto, clear
_pctile weight, nq(100)
return list #this is optional
drop if weight>r(r99) #top 1 percent
于 2013-08-05T15:00:07.570 回答
0
要在 stata 中选择 30 个顶级观测值,请使用以下命令:
keep if (_n<=30 )
要删除 stata 中的前 30 个观察值,请使用以下命令
keep if (_n>30)
于 2015-11-04T14:15:50.660 回答