问题标签 [reshape]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
265 浏览

r - openAir,96x31 时间/日期数据转换成堆叠数据

我有一张表格,显示一天中每 15 分钟和每月每一天的可变流量,例如:

我想把它变成表格

等等。我已经尝试过reshape,但我不明白如何指定“变化”并不断收到失败消息。

0 投票
1 回答
368 浏览

stata - 以“链”格式重塑数据(stata .DTA 文件)

我有“链”格式的数据,其中有受试者获得治疗“锁”和从每个“锁”招募的受试者或“链接”。因此,我的数据既宽又长——我如何编写 Stata .DTA 程序来重塑运行模型?我的数据是这样开始的

idlock idlink1 idlink2 ...

1 10 11 ...

2 20 21 ...

21 30 31 ...

并且链接可以稍后成为锁,但它仍然是原始锁链的一部分。因此,21 是链中以 1 开头的链接。每个新锁最多有 5 个链接(idlink1-idlink5)

0 投票
1 回答
1262 浏览

r - 在R中将数据重塑为面板格式

我有一个很长而且(对我来说)很复杂的问题。我有来自欧盟理事会的投票数据,其中每个国家的投票行为都根据名义规模进行了编码:

数据采用以下格式(请参阅帖子末尾的数据集中 20 个观察值的转储):

首先,我想将数据汇总为每月间隔,每个月我们都有每个国家有多少个 0、1、2 等的总和。理想情况下,数据应如下所示:

完成此操作后,我想将数据放入面板格式,如下所示:

如果这是一个非常耗时的问题,我很抱歉,但我一直在玩聚合、不同的应用函数,但无法获得预期的结果。任何帮助将不胜感激!

来自数据集的 20 个观察值(来自 dput() 函数的输出):

0 投票
2 回答
4401 浏览

r - 如果我的分组变量是一个因素,我如何生成按组汇总统计?

假设我想获得一些关于数据集的汇总统计信息mtcars(基础 R 版本 2.12.1 的一部分)。下面,我根据汽车的发动机气缸数对汽车进行分组,并采用 中剩余变量的每组均值mtcars

但是,如果我的分组变量恰好是一个因素,事情就会变得更加棘手。ddply()对因子的每个级别都发出警告,因为不能接受mean()因子的。

所以,我想知道我是否只是以错误的方式生成汇总统计信息。

通常如何生成按因素或按组汇总统计数据的数据结构(如均值、标准差等)?我应该使用其他东西ddply()吗?如果我可以使用ddply(),我该怎么做才能避免在尝试取分组因子的平均值时导致的错误?

0 投票
2 回答
6440 浏览

r - R reshape2 中的 cast() 调用的自定义聚合函数出错

我想使用 R 将具有非唯一行名的表中的数值数据汇总到具有唯一行名的结果表中,其中的值使用自定义函数进行汇总。总结逻辑是:如果最大值与最小值之比 < 1.5,则使用值的平均值,否则使用中值。因为表很大,所以我尝试使用reshape2包中的 melt() 和 cast() 函数。

上面的最后一行代码会导致错误通知。

我究竟做错了什么?请注意,如果 summarise 函数只返回 min() 或 max(),则不会出现错误,但会出现有关“没有非缺失参数”的警告消息。谢谢你的任何建议。

(我要使用的实际表是 200x10000 的表。)

0 投票
2 回答
255 浏览

r - R:堆叠多打题数据

假设我们在一项调查中有 2 个问题,一个是关于个人推荐一家公司的可能性(为简单起见,假设有 2 家公司)。

所以,对于这个问题,我有一个包含 2 列的 data.frame:

并且,假设我们有另一个问题,要求受访者在他们认为“适合”公司的属性旁边勾选一个框。

所以,对于这个问题,我有另一个包含 4 列的 data.frame:

现在,我想做的是查看属性 1 和 2 如何与所有公司(独立于公司)推荐问题的可能性范围相关。例如,只是为了了解那些极有可能推荐和属性 1 的人之间存在哪些惯性。

因此,我首先将两个问题绑定在一起:

我的问题是试图弄清楚如何堆叠这些数据,使列看起来像:

这个例子在很大程度上被简化了。在我的实际问题中,我有 34 个公司和 24 个属性。

你能想出一种方法来有效地堆叠它们,而不必输入所有的 c() 语句吗?

注意:可能性的列模式是 Co1,Co2,Co3,Co4...,属性的模式是 At1.Co1,At2.Co1,At3.Co1 ... At1.Co34,At2.Co34...

0 投票
3 回答
34640 浏览

r - 在R中获取堆积面积图

这个问题是我上一个问题的延续。

现在我有一个案例,其中还有一个带有 Prop 的类别列。所以,数据集变成了

在这种情况下,我需要在 R 中制作一个堆积面积图,其中包含每天这些不同类别的百分比。所以,结果会是这样的。

所以现在我会得到每个类别在每个小时内的份额,然后绘制这是一个像这样的堆积面积图,其中 x 轴是小时,y 轴是由不同颜色给出的每个类别的 Prop2 百分比这个

0 投票
5 回答
5285 浏览

r - 如何将列转换为R中的行?

我有同样的问题。我有这种顺序的数据:;=column

我喜欢这样:

我想对 D1 进行排序并想重塑它?有人有想法吗?我需要为 D1 的 7603 值执行此操作。

0 投票
2 回答
9665 浏览

r - 使用多个变量和一些时间不变将数据框从宽到面板重塑

这是Stata一步处理的数据分析中的一个基本问题。

创建一个宽数据框,其中包含时不变数据 (x0) 和 2000 年和 2005 年的时变数据 (x1,x2):

英石

我想把它塑造成一个面板,所以数据看起来像这样:

我可以用reshapest做到这一点

我主要担心的是,当你有几十个变量时,上面的命令会变得很长。一种是简单地输入stata

R中有这么简单的解决方案吗?

0 投票
2 回答
1322 浏览

r - R 中最快的 Tall-Wide 旋转

我正在处理一个简单的表格

对(日期,变量)是唯一的。我想把这张桌子变成一张宽幅桌子。

而且我想以最快的方式做到这一点,因为我必须在具有 1e6 条记录的表上反复重复该操作。tapply()在 R 原生模式下,我相信reshape()d*ply()都在速度方面由data.table. 我想针对基于 sqlite 的解决方案(或其他数据库)测试后者的性能。以前有这样做过吗?有性能提升吗?而且,当“宽”字段(日期)的数量是可变的并且事先不知道时,如何在 sqlite 中将高到宽转换?