1

我有一个数据集,想在一端删除 1% 的数据。例如,我有 3000 个观察值,我想删除 30 个最高的观察值。有这种修剪的命令吗?顺便说一句,我是Stata的新手。

4

3 回答 3

1

如果你知道你的 drop 的截止值是多少,你可以使用:

drop if var1>300

删除所有var1超过 300 的行。

您可以使用summarize var1, detail获取关键百分位数:它将为您提供 1% 和 99% 的百分位数以及其他标准百分位数。

于 2013-08-05T14:09:09.753 回答
1

您可以_pctile在 Stata 中使用它。

sysuse auto, clear
_pctile weight, nq(100)
return list  #this is optional 
drop if weight>r(r99) #top 1 percent 
于 2013-08-05T15:00:07.570 回答
0

要在 stata 中选择 30 个顶级观测值,请使用以下命令:

keep  if (_n<=30 )

要删除 stata 中的前 30 个观察值,请使用以下命令

keep if (_n>30)
于 2015-11-04T14:15:50.660 回答