问题标签 [rdata]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
708 浏览

r - 在 R 中读取大型 CSV 文件并使用行数导出为多个 RData 文件并跳过

我正在尝试分段导入和导出一个 10GB 的 CSV 文件,其中包含大约 1000 万个观察值。最后我想要大约 10 个可管理的 RData 文件(data_1.RDatadata_2.Rdata等),但我在制作skipnrows动态时遇到了麻烦。我nrows永远不会改变,因为我每个数据集需要近 100 万行,但我想我需要一些等式,skip=以便每个循环增加以捕获接下来的 100 万行。此外,由于只有第一行将包含变量名,因此header=T可能会搞砸任何事情。ii=1以下是我正在使用的大部分代码:

0 投票
0 回答
3273 浏览

r - RStudio 在“保存工作区图像”时冻结,之前保存的 .RData 文件消失了

首先,我还在 RStudio 支持页面上发布了这个问题。如果我在那里得到回复,我会在这里发布给所有人看(反之亦然)。

我很喜欢 RStudio,但在使用 Rprojects 保存模型输出时遇到了麻烦。我正在运行需要大约 1 天才能运行的模型集,所以这真的让我退缩了。这是在运行 10.9.5 (Mavericks) 的 iMac 上。

这是发生的事情:

我关闭项目并允许“保存工作区图像”通过。(这大约需要 15 分钟,并且 Rdata 文件为 6GB - 这对我来说似乎大得惊人)。

重新打开时通常没有问题,Rdata 文件被恢复,我看到我在 Global Environment 窗格中创建的对象。我运行另一个模型(或一组),然后再次关闭项目。RStudio 现在挂断了“保存工作区图像”。最终,显示它处于活动状态的轮子停止转动。有时鼠标从屏幕上消失,整个计算机都死机了。

我要么强制 RStudio 关闭,要么强制关闭计算机。当我重新启动并打开 RStudio,然后加载 Rproject 时,全局环境为空。在“文件”窗格中,没有显示 .RData 文件。

当我在 Finder 中检查 Rproject 目录时,有多个 .RDataTmp (隐藏)文件。我不清楚我是否可以使用它们中的任何一个来恢复我的数据,或者如何尝试在 RStudio 中加载它们。

到目前为止我尝试过的解决方案:

  1. 根据 RStudio 支持上的另一篇文章更新所有内容,包括 R、RStudio 和 Safari。

  2. 禁止我的同步程序 (SugarSync) 更新 .Rproj.user 文件,也是在阅读了那里的帖子之后。

  3. 在隐私/安全设置中启用对 RStudio 的访问。

我还没有找到任何其他可能的解决方案,而且我对测试它感到越来越沮丧,因为它似乎只是间歇性地发生并且(叹息)在问题似乎得到解决之后,所以我已经运行了一大堆模型并有大量数据要丢失!这让我想知道(a)宇宙是否只是残酷的,或者(b)是导致问题的大文件大小。另一个选项是(c)两者。

我在 RStudio Support 的其他地方读到可以启用文件压缩,但这会减慢保存过程。由于在关闭项目时已经花费了相当长的时间来保存,而且我不清楚它为什么会有所帮助,所以在我了解更多信息之前,我很犹豫是否启用文件压缩。

谢谢你的帮助,

MK

0 投票
3 回答
913 浏览

r - R:具有最大值的子集/组数据帧?

给定这样的数据框:

如何对gid具有最大值set和 1/0 的唯一数据框进行子集/分组,其a值是否大于其b值?

所以在这里,它会是,呃...

SQL中的一种愚蠢的简单事情,但我想更好地控制我的R,所以......

0 投票
1 回答
172 浏览

r - 在不同的 R 工作区中组合同一列表的不同元素

例如:三个 R 工作A.RDataB.RDataC.RData

  • In A.RData: 一个列表对象list.example <- list(1,2)
  • In B.RData: 同名列表对象list.example <- list(NULL,NULL,3)
  • In C.RData: 同名列表对象list.example <- list(NULL,NULL,NULL,4)

我想在新工作区中得到一个list.new.example打印为的对象:

我努力了

但这不是我想要的。NULL正在填充。那谢谢啦。

0 投票
1 回答
5532 浏览

r - 将 R 对象转换为 csv/文本文件

有没有人尝试将 R 对象转换为文本文件?我有从 Seqmeta 包创建的 R 对象,并试图将其转换为文本文件

然后我尝试了

如何将数据转换为 csv 格式?

0 投票
3 回答
7702 浏览

r - 在 Rstudio 中加载数据时出现错误“ReadItem:未知类型 161,可能由更高版本的 R 编写”?

当我尝试在 Rstudio 中加载一个干净的数据时,文件名为 salesClean.RData,我收到错误。

错误信息是:ReadItem: unknown type 161, perhaps written by later version of R

错误信息截图: 截屏

0 投票
1 回答
3109 浏览

r - 如何循环加载多个 RData?

我想将几个RData文件加载到 R 中。我使用的代码是

我也试过:

这导致了这个错误:

我想要的是让每个RData加载为:

但这显然行不通。谁能给我一个解决方案。

最好的,并提前感谢

0 投票
2 回答
1102 浏览

r - 将Rdata列表转换为R中的数据框

我有 1000 个保存为 Rdata 的列表,全部保存在一个目录中。每个列表具有相同的名称,有 5 个项目,如下所示:

list.hv_Amano_volume

当第一次将文件存储在我的目录中时,我给每个文件一个唯一的名称,即:1_list.hv_Amono_volume_rand.Rdata,

2_list.hv_Amano_volume_rand.Rdata,

3_list.hv_Amono_volume_rand.Rdata ... 1000_list.hv_Amono_volume_rand.Rdata

我已按如下方式加载了所有 1000 个 Rdata 文件:

但现在我不知道如何从这个列表中提取数据,显然'temp'给了我这个

[11]“107_list.hv_Amono_volume_rand.Rdata”“108_list.hv_Amono_volume_rand.Rdata”[13]“109_list.hv_Amono_volume_rand.Rdata”“11_list.hv_Amono_volume_rand.Rdata”
[15]“110_list.hv_Amono_rando_volume_rand.Rdata”“111.mono_list.hvA “……

所以我现在需要知道如何从列表中提取数据并将其绑定到具有 1000 列的数据框,如下所示:

我试过玩这个 named.list <- lapply(temp,load)

和这个

但老实说,我很迷茫,没有得到任何帮助,所以非常感谢您的帮助。

0 投票
0 回答
247 浏览

r - 长路径名工作区无法在 R 中加载

我有大量 .Rdata 文件加载到 R 中以执行一些分析,大约 65 500 个。每个文件代表一个统计模型,以便执行 APM 分析。由于我以它保存的模型命名每个文件,其中一些文件名很长,最长为 190 个字符(包括路径名)。

我通过读取文件夹中的所有文件名来加载 .Rdata 文件,然后使用 for 循环加载它们(下面的简化代码):

但是,当它遍历文件时,总是说文件丢失了。我已检查以确保该文件不为空或计算机错误地认为它存在 - 但该文件确实存在。

我在其他地方读到其他语言的路径有 260 个字符的限制 - R 中是否有类似的限制?我拥有的最长路径是 190,远低于我在其他地方读到的 260 限制。

有没有人对为什么会发生这种情况有任何建议?

更新

我得到的具体错误是:

我可以确认该文件确实存在,并且可以通过自行双击来加载该文件。但它不会在循环中打开。

0 投票
1 回答
2483 浏览

python - 使用 rpy2 将 .RData 文件读入 python

我正在尝试使用 rpy2 模块将 .RData 文件读入 python。下面是代码

我目前使用的是 Windows 7、64 位机器。请帮忙。