问题标签 [tibble]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 子样本的样本
我想从数据集中选择一个样本两次。实际上,我不想选择它,而是要创建一个新变量sampleNo
来指示一个案例属于哪个样本(一个或两个)。
假设我有一个包含 40 个案例的数据集:
我画的第一个样本(n=10)是这样的:
现在,(我的问题从这里开始)我想绘制第二个样本(n=10)。但是这个样本应该只从不属于第一个样本的案例中抽取。此外,“var1”应该是偶数。
所以sampleNo
对于根本没有抽取的案例应该是 0,对于属于第一个样本的案例应该是 1,对于属于第二个样本的案例应该是 2(=sampleNo
等于 0 并且var1
是偶数)。
我试图这样解决它:
但是我怎样才能设置sampleNo
为 2?
r - 从 data.frame 中对特定列和行进行子集化 - 错误消息“...中的意外符号”
我是一名初学者,正在学习如何从 R 中的数据集中对特定行和列进行子集化。我正在使用 R Studio 中的 state.x77 数据集作为练习。当我尝试选择指定的列时,我收到以下错误消息:
我不明白那行代码中的哪个符号不正确。
另外,如果除了选择某些列(变量)之外,我还尝试过滤某个状态,那么当状态列表是行名时如何使用过滤功能?当我尝试:
它为状态名称创建了一个名为 State 的列,但是当我查看 state.x77 时它似乎不是永久性的(因此我不能使用过滤器功能)。
对不起,我是一个非常初学者。任何帮助,将不胜感激。
谢谢你。
r - 我如何在 R 中连续的小标题行上进行滚动 cumsum
我有一个 tibble 的玩具示例。将按 x 分组的 y 的两个连续行求和的最有效方法是什么
所以输出会是这样的
我想使用 RcppRoll 包中的 tidyverse 和可能的 roll_sum() 并拥有代码,以便将可变长度的连续行用于现实世界的数据,其中会有很多组
TIA
r - 从列表中重复出现的字符串模式实例中提取标题数据
我有一个特定的清单:
我str_extract_all
用来收集符合特定模式的部分数据。
我想在一个小标题上显示结果,指示从中提取模式的源(即列表标题)。由于在 $C 中重复出现“bb”,这会产生以下错误。
当没有重复出现时,代码可以正常工作。
如何编码以避免错误?
在研究我的解决方案时,我认为我的问题最终归结为:
grep()
告诉我具体的字符串模式可以在我列表的第一项和第三项中找到。
我宁愿做的是在grep()
发现模式重复出现时重复项目编号。
我应该能够使用这种模式来生成一个源向量,并在以后cbind()
使用我的str_extract()
结果:
解决方案:
这是我自己解决问题的方法。
即使重复的模式嵌入到子字符串中(如上),这也有效。
arrays - 无法将 tibble 转换为 R 中的数组?
我试图将一个非常简单的 1x4 tibble 转换为数组:
它给了我以下错误消息:
mapply(FUN = f, ..., SIMPLIFY = FALSE) 中的错误:零长度输入不能与非零长度的输入混合另外:警告消息:1:在 is.na(x) 中:is.na () 应用于“NULL”类型的非(列表或向量)2:在 is.na(x) 中:is.na() 应用于“NULL”类型的非(列表或向量)
在数组函数中,问题似乎是dim(data) <- dim
部分原因......我确实想出了一个解决方案,即将小标题变成数据框:
但我不太确定为什么我必须通过额外的步骤。有人可以告诉我我错过了什么吗?
r - dplyr 表格显示样式更改
曾经有一段时间,当列的总宽度不方便并排时,dplyr 小标题显示对齐就像 data.frame 一样。
并tibble.width
设置为默认值,
现在时代变了,我在屏幕上看到了这个。
和options(tibble.width = Inf)
有没有办法像数据框一样显示小标题的“宽度溢出”情况?我希望有options(dplyr.display_beautiful=TRUE)
一种解决方案。
r - bind_rows_(x, .id) 中的错误:无法将列从因子转换为数字
我有十个使用xlsx库从 Excel 文件中读取并存储在小标题中的数据集。我想合并它们。
以下是示例数据集。数据集之间的变量数量不同,并且某些变量仅在一个数据集中。person变量的值永远不会重叠。
实际的数据集通常有大约 50 行和大约 200 个变量。我努力了
希望能得到这样的结果
但是我得到了这个错误
我搜索了 Stackoverflow,发现了与此相关的问题,大多数答案都集中在尝试将变量转换为另一个类。但我不在乎我的变量有哪些类,因为我只会将合并的数据集写入 CSV 文件或 Excel 文件。
没有某种简单的解决方法吗?
r - 如何将 R 中的 dplyr 输出格式化为双精度(或其他可行格式)?
我如何得到这个结果是数值与小标题。
这给了我这样的输出:
我想将每个值添加到其对应的向量中,因为我使用的是重采样方法。但是,如果我按以下方式索引:prop_smoking[1,2]
它给了我一个 tibble 类型。因此,当我将它添加到其相应的向量中并想要像使用向量一样执行循环和减去平均值等操作时,我会得到一个“二进制运算符的非数字参数”。我如何索引或转换这些值以便它们易于使用(即doubles
)
r - 将两个数据框绑定在一起时如何合并因子?
这是一个相当少的复制代码。真实的数据集比较大,因子也比较多,所以手动列出因子是不切实际的。数据上还有更有趣的转换,我想继续使用 dplyr。
这会产生:
这些警告很烦人,如果我不使用,它们实际上会消失group_by
:
显式转换为data.frame
之前rbind
也可以:
是否有一种简单的方法使用基本 R 或 dplyr rbind
/bind_rows
自动合并这些因素及其级别,而不是将它们转换为字符(这对我来说意义不大),同时仍然使用 dplyr 进行数据转换?
我发现https://stackoverflow.com/a/30468468/388803提出了一种手动合并因素的解决方案,但这非常冗长。
我的实际用例是加载两个 .csv 文件read.table
,进行一些数据转换,然后合并数据,因为它们是互补的。我目前的解决方法是data.frame(data)
在数据转换结束时调用。我想知道为什么 dplyr/tibble 不会自动合并因子,因为在这种情况下看起来很安全。这是可以改进的东西吗?
r - 因子到因子的条件重新编码
我有一个小标题,df
有一个因素A
,我希望:
1) 的副本C
, 和
2) 基于第二个变量B
.
目前我正在以这种迂回的方式进行操作。我对因子的条件重新编码感到非常困惑。我也看过dplyr
'srecode
,但找不到更聪明的方法。
我最初的微博
我当前解决方案中的第 1 步
我当前解决方案中的第 2 步
我该怎么做?