问题标签 [spread]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 带有重复项的 R 扩展函数 - 添加瞬态行后仍然无法工作
试图让 spread() 函数与键列中的重复项一起工作 - 是的,这已经被覆盖过,但我似乎无法让它工作,我花了一天的大部分时间在它上面(有点R 的新手)。
我有两列数据。第一列“下雪日”代表冬季的第一天,“深度”列中对应的积雪深度。这是几年的数据(约 62 年)。因此,下雪天列应该有六十二年的第一、第二、第三等天——这会在下雪天产生重复:
我添加了一个“行”列以使数据框更加瞬态(我隐约理解为 1:4638 行是每年 75 天在约 62 年中进行的总测量值。现在我想传播它宽的:
我全为零:
我希望它看起来像这样(列由“下雪天”定义,行值是在不同年份记录的特定日期的各种深度 - 例如第 1 天到第 11 天:
我想我在这里基本上遗漏了一些东西——我尝试过通过 drop=TRUE 或 convert = TRUE 工作,输出值要么全为零,要么全是 NA,这取决于我如何修补。此外,data.frame(seasondata) 中的所有值都是整数。有什么想法吗?
php - 创建更好的随机算法的问题 - 每日点差
我需要一个算法,按照该时间规则的最小/最大百分比将一些数字按百分比分布在一天中,这就是我拥有的 atm:
结果:
任何优化它并使其更“随机”的方法,我都希望能够增加最小、最大规则,但如果我这样做,最终元素会受到影响,并且总是变成 0
Id 实际上是按小时创建它的最佳选择,而不是按小时创建。
r - tidyr 中的 spread() 可以跨多个值传播吗?
我正在使用iris
数据集,首先,我对该数据集进行了一些操作,并将其制成以下形式
看起来像
我想使用中的spread()
函数tidyr
使数据集最终看起来像以下格式
我所做的是以下内容:
这使
我尝试将行号添加到“D4”,因为我发现有时该spread()
函数会导致出现一些错误,如此处所述。我不知道是否有一种巧妙的方法可以spread()
用来实现这个目标。
r - 从长到宽传播数据
我正在努力理解如何使用 tidyr 的传播功能从长数据格式变为宽数据格式。假设我有以下数据集:
看起来像,
我想将其折叠成以下格式:
如果我理解语法,我相信这很简单。spread(site, numbers.one) 为 numbers.one 值生成 S1 和 S2 列,但不是 numbers.two (加上每年的多行和 NAs 作为填充符),我看不到如何指定要传播的多列。我是不是漏掉了一个步骤,比如把所有相同的岁月聚集在一起,然后传播?
r - 庞大的数据框进行传播
我有一个巨大的df,尺寸是(58556185 X 2)
并且唯一用户和唯一页面分别为 100,000 和 50,000 我想将其传播到
我已经使用了这段代码,它适用于小型数据集
但是当适用于巨大的df时,它就出来了Error: cannot allocate vector of size 21626.2 Gb
有什么建议么?谢谢
r - 聚类计算教程 - 传播问题
在遵循这个非常有趣的教程(https://rpubs.com/hrbrmstr/customer-segmentation-r)时,我遇到了一个我不太明白的错误。
这是导致消息“错误:输入中不存在值列'n'”的代码段。在 Rstudio 1.0.136 中:
最后一行是造成问题的行。
有人会知道为什么吗?
r - tidyr - 分布多列
我正在为网络荟萃分析准备数据,我很难整理列。
如果我有这个初始数据集:
我怎样才能完成另一个?
我真的被困在这一步,我真的很感激一些帮助......
r - 在 data.tables 上传播值
我是 R 新手,我想知道是否有一个用于传播的库,通过传播我的意思是,例如,如果我有这个 data.table:
我将 15 分配到该V4
列:
将调整这些值,使总和现在为 15:
(新值乘以 15/sum(column) --> 15 / 10)
这是我必须做的最简单的例子,这就是为什么我问是否有图书馆。
r - 如何在使用 spread() 重塑数据框时解决错误
我正在尝试将长数据框转换为宽且带有标记的案例。我旋转它并使用一个临时向量作为标志。它在小型数据集上完美运行:请参阅示例(复制并粘贴到您的 Rstudio),但是当我尝试对真实数据执行此操作时,它会报告错误:
churnTrain3 <- spread(churnTrain, key = "state", value = "temporary", fill = 0) 错误:行 (169, 249), (57, 109), (11, 226) 的标识符重复
结构范围的数据集与进一步处理相关 是否有任何解决此问题的方法。我敢打赌,很多人试图清理数据并解决同样的问题。请帮帮我这是代码: 第一个块“示例”制作小数据集以实现良好的可视化效果 第二个块“真实数据”是来自流失库的数据集的切片部分