问题标签 [rdata]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 在 R 中读取大型 CSV 文件并使用行数导出为多个 RData 文件并跳过
我正在尝试分段导入和导出一个 10GB 的 CSV 文件,其中包含大约 1000 万个观察值。最后我想要大约 10 个可管理的 RData 文件(data_1.RData
、data_2.Rdata
等),但我在制作skip
和nrows
动态时遇到了麻烦。我nrows
永远不会改变,因为我每个数据集需要近 100 万行,但我想我需要一些等式,skip=
以便每个循环增加以捕获接下来的 100 万行。此外,由于只有第一行将包含变量名,因此header=T
可能会搞砸任何事情。ii=1
以下是我正在使用的大部分代码:
r - RStudio 在“保存工作区图像”时冻结,之前保存的 .RData 文件消失了
首先,我还在 RStudio 支持页面上发布了这个问题。如果我在那里得到回复,我会在这里发布给所有人看(反之亦然)。
我很喜欢 RStudio,但在使用 Rprojects 保存模型输出时遇到了麻烦。我正在运行需要大约 1 天才能运行的模型集,所以这真的让我退缩了。这是在运行 10.9.5 (Mavericks) 的 iMac 上。
这是发生的事情:
我关闭项目并允许“保存工作区图像”通过。(这大约需要 15 分钟,并且 Rdata 文件为 6GB - 这对我来说似乎大得惊人)。
重新打开时通常没有问题,Rdata 文件被恢复,我看到我在 Global Environment 窗格中创建的对象。我运行另一个模型(或一组),然后再次关闭项目。RStudio 现在挂断了“保存工作区图像”。最终,显示它处于活动状态的轮子停止转动。有时鼠标从屏幕上消失,整个计算机都死机了。
我要么强制 RStudio 关闭,要么强制关闭计算机。当我重新启动并打开 RStudio,然后加载 Rproject 时,全局环境为空。在“文件”窗格中,没有显示 .RData 文件。
当我在 Finder 中检查 Rproject 目录时,有多个 .RDataTmp (隐藏)文件。我不清楚我是否可以使用它们中的任何一个来恢复我的数据,或者如何尝试在 RStudio 中加载它们。
到目前为止我尝试过的解决方案:
根据 RStudio 支持上的另一篇文章更新所有内容,包括 R、RStudio 和 Safari。
禁止我的同步程序 (SugarSync) 更新 .Rproj.user 文件,也是在阅读了那里的帖子之后。
在隐私/安全设置中启用对 RStudio 的访问。
我还没有找到任何其他可能的解决方案,而且我对测试它感到越来越沮丧,因为它似乎只是间歇性地发生并且(叹息)在问题似乎得到解决之后,所以我已经运行了一大堆模型并有大量数据要丢失!这让我想知道(a)宇宙是否只是残酷的,或者(b)是导致问题的大文件大小。另一个选项是(c)两者。
我在 RStudio Support 的其他地方读到可以启用文件压缩,但这会减慢保存过程。由于在关闭项目时已经花费了相当长的时间来保存,而且我不清楚它为什么会有所帮助,所以在我了解更多信息之前,我很犹豫是否启用文件压缩。
谢谢你的帮助,
MK
r - R:具有最大值的子集/组数据帧?
给定这样的数据框:
如何对gid
具有最大值set
和 1/0 的唯一数据框进行子集/分组,其a
值是否大于其b
值?
所以在这里,它会是,呃...
SQL中的一种愚蠢的简单事情,但我想更好地控制我的R,所以......
r - 在不同的 R 工作区中组合同一列表的不同元素
例如:三个 R 工作A.RData
区B.RData
和C.RData
。
- In
A.RData
: 一个列表对象list.example <- list(1,2)
- In
B.RData
: 同名列表对象list.example <- list(NULL,NULL,3)
- In
C.RData
: 同名列表对象list.example <- list(NULL,NULL,NULL,4)
我想在新工作区中得到一个list.new.example
打印为的对象:
我努力了
但这不是我想要的。NULL
正在填充。那谢谢啦。
r - 将 R 对象转换为 csv/文本文件
有没有人尝试将 R 对象转换为文本文件?我有从 Seqmeta 包创建的 R 对象,并试图将其转换为文本文件
然后我尝试了
如何将数据转换为 csv 格式?
r - 在 Rstudio 中加载数据时出现错误“ReadItem:未知类型 161,可能由更高版本的 R 编写”?
当我尝试在 Rstudio 中加载一个干净的数据时,文件名为 salesClean.RData,我收到错误。
错误信息是:ReadItem: unknown type 161, perhaps written by later version of R
错误信息截图:
r - 如何循环加载多个 RData?
我想将几个RData
文件加载到 R 中。我使用的代码是
我也试过:
这导致了这个错误:
我想要的是让每个RData
加载为:
但这显然行不通。谁能给我一个解决方案。
最好的,并提前感谢
r - 将Rdata列表转换为R中的数据框
我有 1000 个保存为 Rdata 的列表,全部保存在一个目录中。每个列表具有相同的名称,有 5 个项目,如下所示:
list.hv_Amano_volume
当第一次将文件存储在我的目录中时,我给每个文件一个唯一的名称,即:1_list.hv_Amono_volume_rand.Rdata,
2_list.hv_Amano_volume_rand.Rdata,
3_list.hv_Amono_volume_rand.Rdata ... 1000_list.hv_Amono_volume_rand.Rdata
我已按如下方式加载了所有 1000 个 Rdata 文件:
但现在我不知道如何从这个列表中提取数据,显然'temp'给了我这个
[11]“107_list.hv_Amono_volume_rand.Rdata”“108_list.hv_Amono_volume_rand.Rdata”[13]“109_list.hv_Amono_volume_rand.Rdata”“11_list.hv_Amono_volume_rand.Rdata”
[15]“110_list.hv_Amono_rando_volume_rand.Rdata”“111.mono_list.hvA “……
所以我现在需要知道如何从列表中提取数据并将其绑定到具有 1000 列的数据框,如下所示:
我试过玩这个 named.list <- lapply(temp,load)
和这个
但老实说,我很迷茫,没有得到任何帮助,所以非常感谢您的帮助。
r - 长路径名工作区无法在 R 中加载
我有大量 .Rdata 文件加载到 R 中以执行一些分析,大约 65 500 个。每个文件代表一个统计模型,以便执行 APM 分析。由于我以它保存的模型命名每个文件,其中一些文件名很长,最长为 190 个字符(包括路径名)。
我通过读取文件夹中的所有文件名来加载 .Rdata 文件,然后使用 for 循环加载它们(下面的简化代码):
但是,当它遍历文件时,总是说文件丢失了。我已检查以确保该文件不为空或计算机错误地认为它存在 - 但该文件确实存在。
我在其他地方读到其他语言的路径有 260 个字符的限制 - R 中是否有类似的限制?我拥有的最长路径是 190,远低于我在其他地方读到的 260 限制。
有没有人对为什么会发生这种情况有任何建议?
更新
我得到的具体错误是:
我可以确认该文件确实存在,并且可以通过自行双击来加载该文件。但它不会在循环中打开。
python - 使用 rpy2 将 .RData 文件读入 python
我正在尝试使用 rpy2 模块将 .RData 文件读入 python。下面是代码
我目前使用的是 Windows 7、64 位机器。请帮忙。