问题标签 [stata]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
3162 浏览

group-by - 在Stata的汇总统计表中添加一列差异

如果我在 Stata 中使用 制作一个双向汇总统计表table,我可以添加另一列与其他两列不同的列吗?

假设我有三个变量 ( a, b, c)。我生成五分位数a,然后在每个五分位数 - 五分位数交叉点b生成一个双向均值表。c我想生成第六列,它是 的每个五分位数c的顶部和底部五分位数之间的平均值之差。ba

我可以c为每个五分之一-五分之一交叉点生成平均值表,但我无法计算出差异列。


更新:这是我想做的一个例子。在此处输入图像描述

0 投票
3 回答
7300 浏览

python - 在 python 中保存 .dta 文件

我想知道是否有人知道一个 Python 包,它允许您以.dta统计数据分析软件 Stata 的格式保存 numpy 数组/recarrays。这真的会加快我拥有的系统中的几个步骤。

0 投票
1 回答
3023 浏览

ruby - Heroku Rails 应用程序的数据挖掘/统计分析选项?

我有一个托管在 Heroku 上的 Rails 应用程序,我想为其合并一些实时数据分析。理想情况下,我很想找到一种运行广义增强回归模型的方法,我知道它在两个 R 中都可用(http://cran.r-project.org/web/packages/gbm/index.html)和 Stata (http://www.stata-journal.com/article.html?article=st0087)。我想保存生成的 gbm 树,然后在我的应用程序中使用它来根据用户输入预测新结果。

如果那不可能,我愿意使用其他数据挖掘算法。对我来说最重要的是能够将它集成到我的 Heroku 应用程序中,这样它就可以在没有本地机器的情况下运行。

我研究过的选项:

1) Heroku Support 建议将 R 库出售到 ruby​​ gem 中。我对 ruby​​ 和 rails 比较陌生,这对我来说是可行的吗?我四处寻找有关在 gems 中销售库的说明,但找不到太多。

2)此处的另一个线程(http://stackoverflow.com/questions/6495232/statistic-engine-that-work-with-heroku)提到了 CloudNumbers,但似乎无法从 Rails 应用程序调用该服务。

3) 在他们的一个案例研究中,Heroku 提到了 FlightCaster,它使用 Clojure、Hadoop 和 EC2 进行机器学习 (http://www.infoq.com/articles/flightcaster-clojure-rails)。我看到 Heroku 支持 Clojure,但是有没有办法将它(或更具体地说是 Incanter)集成到我的 Rails 应用程序中?

如果您有任何想法,请告诉我。

0 投票
2 回答
5245 浏览

list - 访问Stata中的列表元素

想象一下,您必须在 Stata 中运行以下命令

等等许多变量。请注意,馈入的过滤器if取决于变量。

我想通过迭代变量列表来做同样的事情。就像是

`

显然,上面的代码在 Stata 中不起作用。我试图了解如何定义一个包含值列表的宏并显式访问列表的每个元素,即

0 投票
3 回答
4929 浏览

regression - 加快Stata中的滚动回归

我应该避免rolling并手动编码滚动回归吗?还是我最好创建一个具有重叠条目并使用的巨型面板statsby?即,给每个窗口自己的by条目。在 RI 中可以将数据预先拆分为日期框架列表,我认为这可以加快后续操作。

一个月前,当我第一次从 R 切换到 Stata 时,我在 Statalist 上问过这个问题,共识是这应该需要很长时间。我在 Mata 中编码和编译了 OLS,发现速度没有提高(实际上,稍微变差了)。

这似乎滚动回归是一种常见的技术,Stata 似乎相当复杂;大多数研究人员是否将这些回归运行了 1 天以上?或者他们是否使用 SAS 进行这些计算?例如,我在 Compustat 数据库上从 1975 年到 2010 年(大约 30,000 次回归)运行以下内容,大约需要 12 个小时。

0 投票
1 回答
1860 浏览

stata - 将 depvar 控制均值添加到回归表输出

这是一项 2 臂随机对照试验。在我的回归输出中,我想评估治疗组中疾病风险的相对降低。为了使评估更容易,我想将因变量控制均值添加到回归表输出的底部。我目前正在estadd使用estout. 下面是我的代码,它显示了因变量的平均值,但是我找不到任何选项estadd,estpost等允许我限制仅研究的一个臂(即控制臂)的 depvar 平均值计算。

0 投票
2 回答
4098 浏览

reshape - 在Stata中生成具有行中变量和列中给定变量的分位数的均值表

...并为差异和 t 统计量添加列。

我学会了如何通过分位数表制作分位数以及如何在此处添加一列/行差异(感谢@lejohn)。

现在,而不是将每一行作为一个变量的一个分位数,我希望每一行都是一个不同的变量,并且每个单元格将是每个变量的平均值,对于每个列中的个体来说,对于给定变量的分位数。

我可以使用 轻松计算单元格条目tabstat,但我想要行中的变量和列中的分位数(tabstat产生转置)。我还希望能够区分列(如我的第一个问题)并计算单元格差异的 t 统计量。

我觉得中间步骤是reshape用三列长数据:id(这里是 acc_d)、变量名和变量值。但我无法弄清楚如何做到这一点,我可能会陷入 R 范式。

这是我想做的类型表的一个例子

在此处输入图像描述

这是我一直(不成功)修改的一些代码

谢谢!

0 投票
1 回答
1483 浏览

stata - 寻找一个示例程序来测试 Stata/MP

我最近购买了在 Linux 服务器上运行的 Stata MP12(8 核)许可证。

有没有人写过一个Stata程序,比如说一个模拟研究来测试Stata MP的性能?我想监控在作业处理过程中实际使用的内核和内存数量。

如果有人可以与我们分享该程序,我将不胜感激。

感谢您的帮助

0 投票
3 回答
2675 浏览

r - 在 R 中保持变量不变的预测边距/预测

我最近切换到 R,我喜欢它。但我最怀念的一件事是能够生成预测模型响应,将某些变量保持在预设水平(平均值、第 90 个百分位数等)。当试图辨别交互项、转换变量等的影响时,这非常方便。

我可以使用该adjust命令在 Stata 中轻松完成此操作。我已经尝试并试图弄清楚如何在 R 中做到这一点,但是使用名为 R 的语言(也有统计 R)和搜索“调整”之类的术语的一大陷阱是我可以似乎只在调整后的 R 平方上找到命中。这令人沮丧。

所以,冒着问一个非常简单的问题的风险,有人知道怎么做吗?我研究了预测边距,这似乎至少是一种相关类型的方法,但它的实现通常涉及以某种方式标准化解释变量。

0 投票
1 回答
2113 浏览

stata - Stata 中“制表双向”频率计数表的 5×5 矩阵

我想创建一个 5×5 的tabulate twoway频率计数表网格,如下表所示。

在此处输入图像描述

使用嵌套循环很容易生成每个子表foreach,但是长列表输出比 5×5 网格更难以解释(并且具有冗余条目——它提供了对称矩阵的两半)。

是否可以在Stata中制作这样的表格?需要明确的是,我可以稍后弄清楚 LaTeX,我只是对获得清晰简洁的控制台输出感兴趣。

谢谢!这是一些使用auto数据进行基本操作的代码,但会生成列表而不是矩阵。xtile来自egenmore包装