问题标签 [tibble]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 使用 dplyr 和 add_row() 在每个组中添加行
如果我向数据集添加新行iris
:
有用。那么,为什么我不能在每个“子集”之上添加一个新行:
r - 如何从基于列表的数据框中将行名转换为列
我有以下基于列表的数据框:
我想要做的是将行名转换为列我收到此错误:
正确的方法是什么?
r - 对数据帧执行逐行 chisq 测试并将结果捕获为 tibble
我有一个类似的数据框:
我将每一行转换为一个表格,然后执行 chisq 测试。
为了从 chisq 结果(p 值、参数、统计量、预期等)中获取特定值,我不得不重复 chisq 测试几次(以一种非常丑陋和繁琐的方式),使用以下代码:
是否有一种更优雅的方法可以只进行一次 chisq 测试并将结果捕获为同一行中的小标题,然后根据需要将值提取到其他列中?
我的数据框有超过一百万行和一些未用于 Chisq 测试的附加变量。
谢谢你。
r - 如何将 tibble 中的行乘以另一个 tibble 中的另一个对应行
我有两个小标题,第一个是这个。
第二个是这个
我想要做的是将Sample1
(和Sample2
)中的每个值与 中的相应基因行值相乘fixed_score
。
为Sample1
因此,在上面的结果中,我们通过以下方式获得值:
结果Sample2
是这样的:
如何使用 data.table 或 dplyr 做到这一点?由于我们的行数非常大。最好有快速的方法。
r - 在最新的 R 工作室(R 版本 3.4.0)中覆盖默认导入 csv 到 tibble
我最近下载并安装了最新版本的 R/Rstudio,并注意到其中一项新变化是在导入 csv 时,Rstudio 现在默认将文件作为 tibble 导入。虽然我意识到开发人员有充分的理由进行此更改,但我个人觉得这非常烦人。
我使用的许多数据文件有很多 (>10) 列,并且我经常使用许多函数来查看数据(即 head()、tail(),甚至从数据中提取特定行,例如data[1:5,]) 不能按我的意愿运行。特别是,在 tibble 上使用这些函数会导致最右边的列不显示,这是非常有问题的,因为我通常对这些列最感兴趣。尽管我使用这些新版本的时间不长,但我已经厌倦了每次要查看数据时都必须使用 View() 函数,或者必须使用 as.data.frame( ) 为了让我的数据以我想要的方式显示。虽然我意识到这似乎是一个相当小的问题,
只是为了保持我自己的理智,有没有办法覆盖这个默认设置并使它导入的所有 csv 都作为数据帧而不是小标题导入?
r - 如何在小标题的每个元素上应用“复杂”的用户定义函数
我已经搜索了这个(看似简单的)问题的答案,但空无一物,所以我希望有人可以帮助我或指出我正确的方向。
我有一个相当复杂的子模型,我想将其应用于数据集,但如果我只使用 use mutate,我会收到错误,Variables must be length 1 or 21.
添加 rowwise() 似乎不会影响它。
让我用下面这个愚蠢的例子来说明这个问题:
我希望有人可以向我解释我在这里做错了什么。
提前谢谢了!
西尔万
r - 如何使用对包含在列表列中的三个模型进行方差分析测试?
嗨:我有 10 个因变量和三个自变量的数据集。我想对每个单独的因变量做一个 OLS,依次添加每个自变量。所以,使用 tidyr 我得到了一些模型。
我想对每个因变量进行方差分析,以相互测试嵌套模型。但是在一堆模型的背景下我该怎么做呢?
r - 在 R 中管理多个模型和运行时间
我正在构建数十个预测模型,以确定一个冠军模型。我正在处理千兆字节的数据,因此跟踪运行时间很重要。
我想以列表类型的格式构建我的所有模型,因此我不必在全局环境中管理所有不同的模型名称。但是,似乎获得每个模型的时间的唯一方法是拥有单独的命名对象。
这是一种接近我正在寻找的基本方法:
但是,如您所见,我必须手动命名每个模型和时间记录。我正在寻找类似于使用以下代码生成的表的内容,其中“xxx”是运行时间的实际记录。
无论使用什么包,我都会很感激提供的任何输入。
r - 计算 NA、NAN 和 Inf 时的奇怪行为
我写了一个小函数来计算 tibble 数据框中的 NA、NaN 和 Inf 的数量,如下所示:
我用以下小标题测试了它:
我得到
这当然是正确的答案。
现在,如果我传递给函数的 tibble 恰好包含日期格式的观察结果,那么函数就会停止工作,我不知道为什么:
关于发生了什么的任何线索?
谢谢
雷马尔
r - 尝试子集小标题的问题
这应该是一个简单的,但我无法弄清楚我做错了什么。可能是一些愚蠢的事情......叹息......
所以在这里,我有一个大的小标题,我试图从中删除一些观察结果。我有一个索引逻辑向量,我想用它来获取我想要摆脱的观察结果:
给了我一个我不想要的观察结果。但是,我还需要访问我正在运行的剩余观察结果
这个不起作用,我拿回原来的小标题减去第一行。
我究竟做错了什么?为了记录,索引变量的属性在下一段代码中。索引的长度和预期的一样,即原始小标题的长度。
谢谢