问题标签 [readstata13]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 在 .dta 文件上使用 read.dta13 时发生二进制读取错误
我正在尝试使用 readstata13 库中的 read.dta13 加载 STATA 数据文件。当我在这个 .dta 文件上使用函数 read.dta13 时,我一遍又一遍地收到以下错误:
char:发生二进制读取错误。
这是什么意思?
这是代码:
install.packages("readstata13") install.packages("foreign")
图书馆(readstata13)图书馆(外国)
dat <- read.dta13("cfps2018person_201911.dta")
excel - Stata循环从Excel文件中检索数据
我的 Excel 文件有很多工作表。我正在尝试创建一个循环来检索每张数据,以便能够将其保存为 .dta。这是我的代码:
输出没有显示任何错误,但也没有保存数据。
r - 在 R 中读取 .dta 文件时出错
我一直在尝试使用“readstata13”库在 ubuntu 18.04 lts 服务器上读取 R(版本 4.0.4)中的 dta 文件,但它给了我以下错误
我已经更新了库,删除并重新安装它,但仍然得到同样的错误。我很感激这方面的任何帮助。
python - pandas.read_stata() 错误:解包需要 4 个字节的缓冲区
我想使用 pandas 读取 .dta 数据集read_stata()
:
但我收到关于解包缓冲区的错误:
我以前能够在 Google Collab 中读取这样的文件(因此问题不在于数据文件本身),但目前当我尝试在本地 PC 上运行代码时出现此错误。
你能告诉我我做错了什么吗?
windows - 如何生成年龄类别?我的 PATIENT_YOB 是 01jan1956,我想得到确切的年龄
我正在尝试使用以下代码,但它给出了错误
stata - 如何生成 AGE 分类/二元变量?
我尝试使用下面的代码,但它在 Stata 中引发错误。
merge - 合并文件时出错: 。错误表示变量 CLAIM_NUMBER 不能唯一标识使用数据中的观察结果。我该如何解决?
在 Stata 中,错误表明变量 CLAIM_NUMBER 不能唯一标识使用数据中的观察值。我该如何解决?我的代码:
stata - 如何在Stata中没有J变量的情况下将特定数据集从长到宽重塑?
我的数据集如下所示:
识别号 | 年 | 指标 | 数据 |
---|---|---|---|
1112000 | 2000 | JKL_ADS | 511 |
1112001 | 2001年 | JKL_ADS | 517 |
1112002 | 2002年 | JKL_ADS | 721 |
1112003 | 2003年 | JKL_ADS | 925 |
1112004 | 2004年 | JKL_ADS | 1092 |
1112000 | 2000 | KLS_DSAK | 351 |
1112001 | 2001年 | KLS_DSAK | 631 |
1112002 | 2002年 | KLS_DSAK | 732 |
1112003 | 2003年 | KLS_DSAK | 823 |
1112004 | 2004年 | KLS_DSAK | 1092 |
我想重塑宽所以它看起来像这样:
识别号 | 年 | JKL_ADS | KLS_DSAK |
---|---|---|---|
1112000 | 2000 | 511 | 351 |
1112001 | 2001年 | 517 | 631 |
1112002 | 2002年 | 721 | 732 |
1112003 | 2003年 | 925 | 823 |
1112004 | 2004年 | 1092 | 1092 |
r - tcltk 包和命令运行时——一个奇怪的交互
我最近遇到了一个奇怪的问题,相同的 read.dta13 命令在一个脚本中花费了一个小时,而在另一个脚本中花费了 2 分钟。我已经将脚本删减到最简单的部分并隔离了问题。
运行大约需要 2 分钟(根据 proc.time() 需要 130 秒)。它有 500,000 行和 200 列,我可以接受 2 分钟。但是,如果我只是通过 tcltk 添加密码,即
然后需要40分钟。为什么指定密码会使 read.dta13 命令花费 30 倍的时间?密码被用于 MySQL 连接,所以我可以先执行 read.dta13,但很奇怪,简单地将密码存储到 pwd 会导致 read.13 花费这么长时间。有人对为什么会发生这种情况有任何解释吗?
r - 使用 readstata13 包从 Stata 导入因子变量时出现问题
我有一个非常奇怪的问题。readstata13
我正在使用package.json将一些因子变量从 Stata 导入 R。导入的标签/级别看起来不错,但在删除因子类时它们会发生变化。这是变量的Stata描述(这里是可重复性的数据):
请注意缺少一些标签(更新:实际上,它们并没有丢失。相反,它们用空格填充,这是编码器用来突出显示丢失标签的奇怪方式)。还要注意变量值 13 有 7 个观察值。
所以我在 R 中导入数据并检查级别和频率。一切都好:
as.integer()
然后我使用(或)删除关卡as.numeric()
,但事情变得一团糟。特别是值 11、12 和 13。请注意,现在 11 有 7 个观察值,而不是 13:
read.dta13
关于与因素相关的选项,问题仍然存在。我使用以下代码尝试了此答案中的第二个建议,但没有奏效(很可能是因为只有两个值有标签):
知道如何解决问题吗?