0

我在 Stata 中运行 DO 清理我的数据集,然后调用 Python 运行脚本以生成一些需要的变量(3 列),使用:

outsheet unique_id group_1 group_2 group 3 group_4 group_5 group_6 group_7 using groups.csv, comma replace

shell python.exe group_fix.py

这将创建一个名为 group_fix.csv 的电子表格,其中包含 4 列 unique_id、group_fix_1、group_fix_2 和 group_fix 3。我想使用 unique_id 字段(在我的数据集和 Py 输出中)来合并这些数据集。所以基本上在 Stata 中,它看起来像在我调用 Py 之前加上我的脚本创建的 3 个新列,这样我就可以继续我的 DO 并进行所需的分析。

有任何想法吗?

4

1 回答 1

0

我认为您正在寻找的是一个临时文件。你可以做这样的事情

sort unique_id
tempfile original
save "`original'"
clear
insheet using group_fix.csv, comma
sort unique_id
merge unique_id using "`original'"

这将创建一个名为“original”的临时文件,用于存储原始数据集。然后,您将使用 python 脚本清理的数据集与 unique_id 上的原始数据合并。另外值得指出的是,在命令中

 save "`original'"

第一个`是tilda下的字符;第二个 ' 是单引号

希望有帮助!

于 2012-10-22T23:21:35.297 回答