问题标签 [rdata]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - rdata:在数据框的行上应用 dist()
我可以做这个:
我得到了我的距离。但是data
其中有超过 1000 行,我想要每行基于 GP 和点的十个最相似的记录,但我不太清楚。
就像是:
但显然这行不通。这里有快速修复吗?
示例数据:
r - R plyr & adply to dplyr (and mutate?) with a custom function
我有一个自定义函数,如下所示:
它被应用在一个数据框上,plyr
就像......
我不知道如何将其迁移到dplyr
using (我猜) mutate()
。如何传递数据框的当前行?我试过这个..
但错误是case
永远不会通过......完全混淆了。
r - R:获取匹配数据框值的列表
两个数据集:
尝试获取每个唯一的数据框pid
及其比较列表,例如:
来不及了。。
r - 权限被拒绝时如何将R对象保存到磁盘?
我计算了一个需要很多时间的 R 对象。但是在使用将其保存到文件write.csv
时,我收到错误消息
我还尝试将此对象保存到.rda
文件,以及将整个工作区图像保存到.RData
文件,但仍然permission denied
出现错误。有没有办法以某种方式将该对象保存到磁盘上,而不是使用 root 访问权限运行 R 并再次重新计算整个事情?..................................................... ..................................................... ...........
更新 :
我正在努力Ubuntu 12.04
。我尝试使用以下方法保存 R 对象:
..................................................... ..................................................... ...........
回答 :
我使用命令创建了一个同名的文件(比如file_name.csv
)touch
。我使用命令更改了它的访问权限chown
,由我(不是root用户)拥有它。然后我使用write.table
带有append=TRUE
选项的命令将数据帧写入新创建的文件,它按预期工作。
r - 从 twitteR 包加载 83mb RData 对象
我有一个仅包含一个列表对象的 83.356MB RData 文件。列表对象有 10 个元素,每个元素都是“状态”对象,它是在使用 twitteR 包查询 Twitter API 时创建的。当我昨天尝试加载这个对象时,我等了半个小时,它仍然没有加载。当我离开它过夜时,它崩溃了R。
所以总结一下,我无法将这个 RData 文件加载到 R 中。我不认为 83MB 太大,而且我相信它在 R 的任何内存限制下,所以我不明白为什么它没有加载.
r - 读入 R 最快的文件格式是什么?
看起来最直观的是 .rdata 文件可能是 R 加载的禁食文件格式,但是在扫描一些堆栈帖子时,似乎更多的注意力集中在了提高 .csv 或其他格式的加载时间上。有确定的答案吗?
r - 将 RData 加载到 Shiny - 数据加载到 R 工作区但不在 Shiny 中,不会产生错误
目标:我试图下载.RData
我上传GitHub
到Shiny
应用程序的数据集(格式),并将该数据集用于各种绘图目的。
技术:我正在使用包中的source_data
函数repmis
将数据加载到我的 R 会话中。这种加载发生在global.R
文件中,所以我确信加载的任何数据都可用于在server.R
文件中绘制函数。
问题:如果我将所有函数从global.R
移至server.R
但就在shinyServer()
函数之前,我看到数据已加载到我的 R 工作区中。
但是,应用程序没有可用的数据Shiny
,没有产生错误,只是没有任何东西可用于绘图,甚至无法使用dim()
.
类似的问题:这里有一个类似的问题,但我没有从中获得任何帮助——无论如何,我是在加载数据Global.R
而不是在server.R
or中ui.R
。
另一个问题在这里,但是用户将数据读入反应源。我的数据不会改变,所以我将它加载到global.R
文件中。
全球.R
服务器.R
用户界面
sql-server - RData 的加载时间比再次查询数据库要长
我在 256GB RAM 服务器上运行 RStudio Server,在另一个服务器上运行 MS-SQL-Server 2012。该数据库包含允许我构建具有约 1 亿个节点和约 1.5 亿条边的图的数据。
我已经计算了从这些数据构建这个图表需要多长时间:
- 第一次 SELECT 查询 = ~22M 行 = 12 分钟 = df1 (dataframe1)
- 第二次 SELECT 查询 = ~30M 行 = 8 分钟 = df2
- 第三次 SELECT 查询 = ~32M 行 = 8 分钟 = df3
- 第 4 次 SELECT 查询 = ~63M 行 = 70 分钟 = df4
edges = rbind(df1, df2, df3, df4)
= 6 分钟mygraph = graph.data.frame(edges)
= 30 分钟
所以两个多小时。mygraph
由于我的数据非常稳定,我想我可以通过保存到磁盘来加快速度。但是当我试图加载它时,它就是不会。等了 4 个小时后,我放弃了,以为出了点问题。
所以我重新启动服务器,删除我的 .rstudio 文件夹并重新开始,这一次以edges
RData 和 RDS 格式(save()
以及saveRDS()
,compress = FALSE
每次)保存来自每个 SQL 查询的数据帧和数据帧。每次保存后,我都会load()
对readRDS()
五个数据帧进行计时。load()
和几乎相同的时间readRDS()
:
- df1 = 1.1 GB 文件 = 1 分钟
- df2 = 1.4 GB 文件 = 2 分钟
- df3 = 1.7 GB 文件 = 6 分钟
- df4 = 3.1 GB 文件 = 13 分钟
- 边缘 = 6.8 GB 文件 = 21 分钟
够好了,我想。但是今天当我开始一个新的会话并尝试对其load(df1)
进行一些更改时,我再次感到有些不对劲。在等待它加载 20 分钟后,我放弃了。内存、磁盘和 CPU 不应该是问题,因为我是唯一使用此服务器的人。我已经重新启动服务器并删除了我的 .rstudio 文件夹,我想也许里面的东西挂起了我的会话,但数据框仍然无法加载。虽然load()
据说正在运行,iotop
但没有显示磁盘活动,这就是我得到的ps
ps -C rsession -o %cpu,%mem,cmd
%CPU %MEM CMD
99.5 0.3 /usr/lib/rstudio-server/bin/rsession -u myusername
我不知道接下来要尝试什么。加载 RData 文件比查询位于不同服务器上的 SQL 数据库需要更长的时间,这对我来说毫无意义。即使它确实如此,那为什么在我保存数据帧后计时load()
和readRDS()
时间时速度如此之快?
这是我第一次在 StackOverflow 上问一些问题,如果我忘记提及一些对您能够回答这个问题很重要的事情,非常抱歉。如果我这样做了,请告诉我。
编辑:布兰登在评论中要求的一些附加信息。操作系统是 CentOS 7。数据帧在前两列(col1=node1;col2=node2)中包含边列表,另外两列用于边属性。所有列都是字符串,长度在 5 到 14 个字符之间。我还在我的原始帖子中添加了每个数据帧的大致行数。谢谢!
r - 如何在 .Rdata 模式下在 R 中使用 .first() 函数
我正在尝试自定义我的 R 设置。我了解我们可以将函数(.First/Last)放入Rprofile.site
or的部分.Rprofile
。但我想走.Rdata
路线。据我了解,如果我的工作目录中的任何 .R 文件中有 .First/.Last 函数。然后当我打开我的.Rdata
文件时,我的自定义设置应该被加载。
虽然我在退出会话时得到了一个 Adios,但是当我打开我的.Rdata
. 无论如何,下面是我的 .First 和 .Last 函数。
r - R:在已部署的 ShinyApp 中仅加载一次 .RData
我需要使用Shiny Server部署一个 ShinyApp 。要运行,我的应用程序需要来自.RData
文件的数据(~300 Mo)。该.RData
文件加载了load(...)
位于global.R
文件中的语句。电脑的功能,加载可能需要几分钟,对用户很不友好。
我们如何才能使.RDate
文件只加载一次,以便每个新用户都不需要重新加载.RData
文件?
谢谢。