问题标签 [splitstackshape]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
966 浏览

r - 带约束的分层抽样

我是 R 的新手,所以请耐心等待。

所以我试图以这样一种方式执行分层抽样,它将使用 2 列地层,但两列都满足特定值。

这是我的代码:

据我了解,此函数首先生成大小为 10% 的层,然后从中选择满足条件 B=30 和 c 介于 8 到 10 之间的那些记录。

结果,地层的大小从最初的 10% 减少了。

我的问题是,有没有什么方法可以生成一个分层,该分层由其中 B 列的值为 30 而 C 列的值在 8 到 10 之间的记录组成nrow()结果样本的值为原始数据的 10%框架?

我正在使用stratified()“splitstackshape”。如果stratified()无法处理,是否还有其他可以执行此类操作的软件包?

0 投票
2 回答
181 浏览

r - cSplit 强制不必要的 NA 行

我有一个大数据集,其中一个小样本看起来像下面的 4 x 5 小标题。我正在尝试使用如下变量将多个分隔列拆分为唯一行c=="Split"

但是,这会强制增加一行 NA,如第 4 行所示:

如果我只拆分两列,这不是问题。如何让它不产生 NA 行?而且,有没有办法在不设置cSplit子集的情况下进行工作c

0 投票
1 回答
839 浏览

r - 在 R 和 ggplot2 图表的顶部删除不必要的标签

运行下面的 R 和 ggplot2 脚本后,会生成以下快照。将鼠标悬停在任何框上时,我们会得到以下工具提示,如图所示。我的简单要求是去掉第四个 tooltip 属性,因为它类似于第三个。我想需要在下面的 ggplot 命令的 aes() 中做一些事情。另外,如果可以在不增加绘图或字体大小的情况下使文本更清晰,请帮助并感谢。

跟踪图

0 投票
2 回答
296 浏览

r - R中具有固定比例观察类型的分层抽样

我有一个样本,其中 50% 的观察结果是白人和 50% 的非裔美国人。

我想获得一个随机子样本,其中该比例被修改为 80% 白人和 20% 非洲裔美国人。

我尝试了分层命令,但找不到允许我将股份分配给分层标准的选项。

预先感谢您的帮助!

0 投票
1 回答
2717 浏览

r - 在 R Shiny 中基于 plotly_click 在图表中显示数据

请在下面运行此脚本,以下 R 脚本提供了一个带有两个框的闪亮仪表板。我想减小两个框之间的宽度并在右侧图表中显示数据。数据应该基于我们在 ggplotly 函数中看到的点击事件。我猜也可以用 plotly 来完成这项工作。我希望代码同时快速高效。

0 投票
2 回答
396 浏览

r - R将逗号分隔的单元格分成行和笛卡尔积

我有mydf下面的数据框。我想拆分任何包含逗号分隔数据的单元格并将其放入行中。我正在寻找类似于y下面的数据框。我怎样才能通过几个步骤有效地做到这一点?目前我cSplit一次在一列上使用函数。

我试过cSplit(mydf, c("name","new"), ",", direction = "long")了,但没用

0 投票
1 回答
158 浏览

r - splitstackshape 包中的 cSplit_e 不考虑 NA?

我想跟进我在此处发布的问题。当我收到解决方案时baseRdata.table我试图按照cSplit_e我之前帖子的评论中的建议从 splitstackshape 包中实现相同的使用。修改后的数据如下(即不适用),

那么,问题是是否cSplit_e考虑了要拆分的列中的 NA?

0 投票
1 回答
80 浏览

r - cSplit_e 不返回二进制数据帧

我有一个数据框,其中有一Genre列的行如Action,Romance. 我想拆分这些值并创建一个二进制向量。如果Action,Romance,Drama是所有可能的流派,那么上述行将1,1,0在输出数据框中。

我发现了这个这个SO 帖子,以及这个 CRAN 文档涵盖 cSplit_e,但是当我使用它时,我没有得到二进制数据帧输出,我得到的是带有一些加扰值的原始数据帧。

编辑:问题似乎是它将新列添加到旧数据框中,而不是创建新框架。我怎样才能让流派进入他们自己的框架?

0 投票
4 回答
86 浏览

r - 拆分连接的列并用值填充相应的列

我有一个令人讨厌的数据表,其中有几种不同类型的混乱,我无法弄清楚如何组合使用tidyrsplitstackshape包的其他一些答案。

这使:

这表现出整洁的混乱,多个变量存储在一列中,以及一些丑陋的格式。

我想要的是一张像这样的桌子:

0 投票
1 回答
63 浏览

r - 重塑(splitstackshape)中的错误?

我很确定这是一个错误,但我只是想先把它放到社区中。在splitstackshape包的Reshape功能示例页面中:

然后,

但是基于宽格式的变量名称(精确的数字后缀),输出不应该是:

由于 VarA 是在所有三个时间点(1,2 和 3)测量的,VarB 是在时间点 2 和 3 测量的,而 VarC 是在时间点 3 测量的。所以我是否遗漏了一些明显的东西......

tidyr版本似乎是正确的