问题标签 [rdata]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
121 浏览

r - rdata:在数据框的行上应用 dist()

我可以做这个:

我得到了我的距离。但是data其中有超过 1000 行,我想要每行基于 GP 和点的十个最相似的记录,但我不太清楚。

就像是:

但显然这行不通。这里有快速修复吗?

示例数据:

0 投票
0 回答
939 浏览

r - R plyr & adply to dplyr (and mutate?) with a custom function

我有一个自定义函数,如下所示:

它被应用在一个数据框上,plyr就像......

我不知道如何将其迁移到dplyrusing (我猜) mutate()。如何传递数据框的当前行?我试过这个..

但错误是case永远不会通过......完全混淆了。

0 投票
1 回答
58 浏览

r - R:获取匹配数据框值的列表

两个数据集:

尝试获取每个唯一的数据框pid及其比较列表,例如:

来不及了。。

0 投票
0 回答
1509 浏览

r - 权限被拒绝时如何将R对象保存到磁盘?

我计算了一个需要很多时间的 R 对象。但是在使用将其保存到文件write.csv时,我收到错误消息

我还尝试将此对象保存到.rda文件,以及将整个工作区图像保存到.RData文件,但仍然permission denied出现错误。有没有办法以某种方式将该对象保存到磁盘上,而不是使用 root 访问权限运行 R 并再次重新计算整个事情?..................................................... ..................................................... ...........

更新 :

我正在努力Ubuntu 12.04。我尝试使用以下方法保存 R 对象:

..................................................... ..................................................... ...........

回答 :

我使用命令创建了一个同名的文件(比如file_name.csvtouch。我使用命令更改了它的访问权限chown,由我(不是root用户)拥有它。然后我使用write.table带有append=TRUE选项的命令将数据帧写入新创建的文件,它按预期工作。

0 投票
0 回答
39 浏览

r - 从 twitteR 包加载 83mb RData 对象

我有一个仅包含一个列表对象的 83.356MB RData 文件。列表对象有 10 个元素,每个元素都是“状态”对象,它是在使用 twitteR 包查询 Twitter API 时创建的。当我昨天尝试加载这个对象时,我等了半个小时,它仍然没有加载。当我离开它过夜时,它崩溃了R。

所以总结一下,我无法将这个 RData 文件加载到 R 中。我不认为 83MB 太大,而且我相信它在 R 的任何内存限制下,所以我不明白为什么它没有加载.

0 投票
1 回答
1389 浏览

r - 读入 R 最快的文件格式是什么?

看起来最直观的是 .rdata 文件可能是 R 加载的禁食文件格式,但是在扫描一些堆栈帖子时,似乎更多的注意力集中在了提高 .csv 或其他格式的加载时间上。有确定的答案吗?

0 投票
1 回答
1277 浏览

r - 将 RData 加载到 Shiny - 数据加载到 R 工作区但不在 Shiny 中,不会产生错误

目标:我试图下载.RData我上传GitHubShiny应用程序的数据集(格式),并将该数据集用于各种绘图目的。

技术:我正在使用包中的source_data函数repmis将数据加载到我的 R 会话中。这种加载发生在global.R文件中,所以我确信加载的任何数据都可用于在server.R文件中绘制函数。

问题:如果我将所有函数从global.R移至server.R但就在shinyServer()函数之前,我看到数据已加载到我的 R 工作区中。
但是,应用程序没有可用的数据Shiny,没有产生错误,只是没有任何东西可用于绘图,甚至无法使用dim().

类似的问题:这里有一个类似的问题,但我没有从中获得任何帮助——无论如何,我是在加载数据Global.R而不是在server.Ror中ui.R
另一个问题在这里,但是用户将数据读入反应源。我的数据不会改变,所以我将它加载到global.R文件中。


全球.R

服务器.R

用户界面

0 投票
0 回答
323 浏览

sql-server - RData 的加载时间比再次查询数据库要长

我在 256GB RAM 服务器上运行 RStudio Server,在另一个服务器上运行 MS-SQL-Server 2012。该数据库包含允许我构建具有约 1 亿个节点和约 1.5 亿条边的图的数据。

我已经计算了从这些数据构建这个图表需要多长时间:

  • 第一次 SELECT 查询 = ~22M 行 = 12 分钟 = df1 (dataframe1)
  • 第二次 SELECT 查询 = ~30M 行 = 8 分钟 = df2
  • 第三次 SELECT 查询 = ~32M 行 = 8 分钟 = df3
  • 第 4 次 SELECT 查询 = ~63M 行 = 70 分钟 = df4
  • edges = rbind(df1, df2, df3, df4)= 6 分钟
  • mygraph = graph.data.frame(edges)= 30 分钟

所以两个多小时。mygraph由于我的数据非常稳定,我想我可以通过保存到磁盘来加快速度。但是当我试图加载它时,它就是不会。等了 4 个小时后,我放弃了,以为出了点问题。

所以我重新启动服务器,删除我的 .rstudio 文件夹并重新开始,这一次以edgesRData 和 RDS 格式(save()以及saveRDS()compress = FALSE每次)保存来自每个 SQL 查询的数据帧和数据帧。每次保存后,我都会load()readRDS()五个数据帧进行计时。load()和几乎相同的时间readRDS()

  • df1 = 1.1 GB 文件 = 1 分钟
  • df2 = 1.4 GB 文件 = 2 分钟
  • df3 = 1.7 GB 文件 = 6 分钟
  • df4 = 3.1 GB 文件 = 13 分钟
  • 边缘 = 6.8 GB 文件 = 21 分钟

够好了,我想。但是今天当我开始一个新的会话并尝试对其load(df1)进行一些更改时,我再次感到有些不对劲。在等待它加载 20 分钟后,我放弃了。内存、磁盘和 CPU 不应该是问题,因为我是唯一使用此服务器的人。我已经重新启动服务器并删除了我的 .rstudio 文件夹,我想也许里面的东西挂起了我的会话,但数据框仍然无法加载。虽然load()据说正在运行,iotop但没有显示磁盘活动,这就是我得到的ps

ps -C rsession -o %cpu,%mem,cmd %CPU %MEM CMD 99.5 0.3 /usr/lib/rstudio-server/bin/rsession -u myusername

我不知道接下来要尝试什么。加载 RData 文件比查询位于不同服务器上的 SQL 数据库需要更长的时间,这对我来说毫无意义。即使它确实如此,那为什么在我保存数据帧后计时load()readRDS()时间时速度如此之快?

这是我第一次在 StackOverflow 上问一些问题,如果我忘记提及一些对您能够回答这个问题很重要的事情,非常抱歉。如果我这样做了,请告诉我。


编辑:布兰登在评论中要求的一些附加信息。操作系统是 CentOS 7。数据帧在前两列(col1=node1;col2=node2)中包含边列表,另外两列用于边属性。所有列都是字符串,长度在 5 到 14 个字符之间。我还在我的原始帖子中添加了每个数据帧的大致行数。谢谢!

0 投票
0 回答
891 浏览

r - 如何在 .Rdata 模式下在 R 中使用 .first() 函数

我正在尝试自定义我的 R 设置。我了解我们可以将函数(.First/Last)放入Rprofile.siteor的部分.Rprofile。但我想走.Rdata路线。据我了解,如果我的工作目录中的任何 .R 文件中有 .First/.Last 函数。然后当我打开我的.Rdata文件时,我的自定义设置应该被加载。

虽然我在退出会话时得到了一个 Adios,但是当我打开我的.Rdata. 无论如何,下面是我的 .First 和 .Last 函数。

0 投票
1 回答
904 浏览

r - R:在已部署的 ShinyApp 中仅加载一次 .RData

我需要使用Shiny Server部署一个 ShinyApp 。要运行,我的应用程序需要来自.RData文件的数据(~300 Mo)。该.RData文件加载了load(...)位于global.R文件中的语句。电脑的功能,加载可能需要几分钟,对用户很不友好。

我们如何才能使.RDate文件只加载一次,以便每个新用户都不需要重新加载.RData文件?

谢谢。