问题标签 [splitstackshape]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

55 问题

0 投票

2 回答

966 浏览

r - 带约束的分层抽样

我是 R 的新手，所以请耐心等待。

所以我试图以这样一种方式执行分层抽样，它将使用 2 列地层，但两列都满足特定值。

这是我的代码：

据我了解，此函数首先生成大小为 10% 的层，然后从中选择满足条件 B=30 和 c 介于 8 到 10 之间的那些记录。

结果，地层的大小从最初的 10% 减少了。

我的问题是，有没有什么方法可以生成一个分层，该分层由其中 B 列的值为 30 而 C 列的值在 8 到 10 之间的记录组成，nrow()结果样本的值为原始数据的 10%框架？

我正在使用stratified()“splitstackshape”。如果stratified()无法处理，是否还有其他可以执行此类操作的软件包？

r splitstackshape

2017-09-07T13:32:27.863

0 投票

2 回答

181 浏览

r - cSplit 强制不必要的 NA 行

我有一个大数据集，其中一个小样本看起来像下面的 4 x 5 小标题。我正在尝试使用如下变量将多个分隔列拆分为唯一行c=="Split"：

但是，这会强制增加一行 NA，如第 4 行所示：

如果我只拆分两列，这不是问题。如何让它不产生 NA 行？而且，有没有办法在不设置cSplit子集的情况下进行工作c？

r string delimiter splitstackshape csplit

2017-11-01T01:32:39.967

0 投票

1 回答

839 浏览

r - 在 R 和 ggplot2 图表的顶部删除不必要的标签

运行下面的 R 和 ggplot2 脚本后，会生成以下快照。将鼠标悬停在任何框上时，我们会得到以下工具提示，如图所示。我的简单要求是去掉第四个 tooltip 属性，因为它类似于第三个。我想需要在下面的 ggplot 命令的 aes() 中做一些事情。另外，如果可以在不增加绘图或字体大小的情况下使文本更清晰，请帮助并感谢。

r ggplot2 plotly ggplotly splitstackshape

2017-11-14T12:02:04.643

0 投票

2 回答

296 浏览

r - R中具有固定比例观察类型的分层抽样

我有一个样本，其中 50% 的观察结果是白人和 50% 的非裔美国人。

我想获得一个随机子样本，其中该比例被修改为 80% 白人和 20% 非洲裔美国人。

我尝试了分层命令，但找不到允许我将股份分配给分层标准的选项。

预先感谢您的帮助！

r random sample splitstackshape

2017-12-04T12:34:00.060

0 投票

1 回答

2717 浏览

r - 在 R Shiny 中基于 plotly_click 在图表中显示数据

请在下面运行此脚本，以下 R 脚本提供了一个带有两个框的闪亮仪表板。我想减小两个框之间的宽度并在右侧图表中显示数据。数据应该基于我们在 ggplotly 函数中看到的点击事件。我猜也可以用 plotly 来完成这项工作。我希望代码同时快速高效。

r ggplot2 shiny plotly splitstackshape

2017-12-21T08:17:26.927

0 投票

2 回答

396 浏览

r - R将逗号分隔的单元格分成行和笛卡尔积

我有mydf下面的数据框。我想拆分任何包含逗号分隔数据的单元格并将其放入行中。我正在寻找类似于y下面的数据框。我怎样才能通过几个步骤有效地做到这一点？目前我cSplit一次在一列上使用函数。

我试过cSplit(mydf, c("name","new"), ",", direction = "long")了，但没用

r dataframe rows delimiter splitstackshape

2017-12-25T16:07:47.373

0 投票

1 回答

158 浏览

r - splitstackshape 包中的 cSplit_e 不考虑 NA？

我想跟进我在此处发布的问题。当我收到解决方案时baseR，data.table我试图按照cSplit_e我之前帖子的评论中的建议从 splitstackshape 包中实现相同的使用。修改后的数据如下（即不适用），

那么，问题是是否cSplit_e考虑了要拆分的列中的 NA？

r splitstackshape

2018-02-02T05:39:31.810

0 投票

1 回答

80 浏览

r - cSplit_e 不返回二进制数据帧

我有一个数据框，其中有一Genre列的行如Action,Romance. 我想拆分这些值并创建一个二进制向量。如果Action,Romance,Drama是所有可能的流派，那么上述行将1,1,0在输出数据框中。

我发现了这个和这个SO 帖子，以及这个 CRAN 文档涵盖 cSplit_e，但是当我使用它时，我没有得到二进制数据帧输出，我得到的是带有一些加扰值的原始数据帧。

编辑：问题似乎是它将新列添加到旧数据框中，而不是创建新框架。我怎样才能让流派进入他们自己的框架？

r splitstackshape csplit

2018-02-20T15:03:24.347

0 投票

4 回答

86 浏览

r - 拆分连接的列并用值填充相应的列

我有一个令人讨厌的数据表，其中有几种不同类型的混乱，我无法弄清楚如何组合使用tidyr和splitstackshape包的其他一些答案。

这使：

这表现出整洁的混乱，多个变量存储在一列中，以及一些丑陋的格式。

我想要的是一张像这样的桌子：

r tidyr splitstackshape

2018-03-08T21:33:46.613

0 投票

1 回答

63 浏览

r - 重塑（splitstackshape）中的错误？

我很确定这是一个错误，但我只是想先把它放到社区中。在splitstackshape包的Reshape功能示例页面中：

然后，

但是基于宽格式的变量名称（精确的数字后缀），输出不应该是：

由于 VarA 是在所有三个时间点（1,2 和 3）测量的，VarB 是在时间点 2 和 3 测量的，而 VarC 是在时间点 3 测量的。所以我是否遗漏了一些明显的东西......

tidyr版本似乎是正确的：

r reshape tidyr splitstackshape

2018-03-14T15:33:40.630

1 2 3 4 5 6 7 8 9 10