问题标签 [splitstackshape]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 带约束的分层抽样
我是 R 的新手,所以请耐心等待。
所以我试图以这样一种方式执行分层抽样,它将使用 2 列地层,但两列都满足特定值。
这是我的代码:
据我了解,此函数首先生成大小为 10% 的层,然后从中选择满足条件 B=30 和 c 介于 8 到 10 之间的那些记录。
结果,地层的大小从最初的 10% 减少了。
我的问题是,有没有什么方法可以生成一个分层,该分层由其中 B 列的值为 30 而 C 列的值在 8 到 10 之间的记录组成,nrow()
结果样本的值为原始数据的 10%框架?
我正在使用stratified()
“splitstackshape”。如果stratified()
无法处理,是否还有其他可以执行此类操作的软件包?
r - cSplit 强制不必要的 NA 行
我有一个大数据集,其中一个小样本看起来像下面的 4 x 5 小标题。我正在尝试使用如下变量将多个分隔列拆分为唯一行c=="Split"
:
但是,这会强制增加一行 NA,如第 4 行所示:
如果我只拆分两列,这不是问题。如何让它不产生 NA 行?而且,有没有办法在不设置cSplit
子集的情况下进行工作c
?
r - R中具有固定比例观察类型的分层抽样
我有一个样本,其中 50% 的观察结果是白人和 50% 的非裔美国人。
我想获得一个随机子样本,其中该比例被修改为 80% 白人和 20% 非洲裔美国人。
我尝试了分层命令,但找不到允许我将股份分配给分层标准的选项。
预先感谢您的帮助!
r - 在 R Shiny 中基于 plotly_click 在图表中显示数据
请在下面运行此脚本,以下 R 脚本提供了一个带有两个框的闪亮仪表板。我想减小两个框之间的宽度并在右侧图表中显示数据。数据应该基于我们在 ggplotly 函数中看到的点击事件。我猜也可以用 plotly 来完成这项工作。我希望代码同时快速高效。
r - R将逗号分隔的单元格分成行和笛卡尔积
我有mydf
下面的数据框。我想拆分任何包含逗号分隔数据的单元格并将其放入行中。我正在寻找类似于y
下面的数据框。我怎样才能通过几个步骤有效地做到这一点?目前我cSplit
一次在一列上使用函数。
我试过cSplit(mydf, c("name","new"), ",", direction = "long")
了,但没用
r - splitstackshape 包中的 cSplit_e 不考虑 NA?
我想跟进我在此处发布的问题。当我收到解决方案时baseR
,data.table
我试图按照cSplit_e
我之前帖子的评论中的建议从 splitstackshape 包中实现相同的使用。修改后的数据如下(即不适用),
那么,问题是是否cSplit_e
考虑了要拆分的列中的 NA?
r - cSplit_e 不返回二进制数据帧
我有一个数据框,其中有一Genre
列的行如Action,Romance
. 我想拆分这些值并创建一个二进制向量。如果Action,Romance,Drama
是所有可能的流派,那么上述行将1,1,0
在输出数据框中。
我发现了这个和这个SO 帖子,以及这个 CRAN 文档涵盖 cSplit_e,但是当我使用它时,我没有得到二进制数据帧输出,我得到的是带有一些加扰值的原始数据帧。
编辑:问题似乎是它将新列添加到旧数据框中,而不是创建新框架。我怎样才能让流派进入他们自己的框架?
r - 拆分连接的列并用值填充相应的列
我有一个令人讨厌的数据表,其中有几种不同类型的混乱,我无法弄清楚如何组合使用tidyr和splitstackshape包的其他一些答案。
这使:
这表现出整洁的混乱,多个变量存储在一列中,以及一些丑陋的格式。
我想要的是一张像这样的桌子:
r - 重塑(splitstackshape)中的错误?
我很确定这是一个错误,但我只是想先把它放到社区中。在splitstackshape包的Reshape
功能示例页面中:
然后,
但是基于宽格式的变量名称(精确的数字后缀),输出不应该是:
由于 VarA 是在所有三个时间点(1,2 和 3)测量的,VarB 是在时间点 2 和 3 测量的,而 VarC 是在时间点 3 测量的。所以我是否遗漏了一些明显的东西......
tidyr版本似乎是正确的: