问题标签 [spread]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
102 浏览

r - 带有重复项的 R 扩展函数 - 添加瞬态行后仍然无法工作

试图让 spread() 函数与键列中的重复项一起工作 - 是的,这已经被覆盖过,但我似乎无法让它工作,我花了一天的大部分时间在它上面(有点R 的新手)。

我有两列数据。第一列“下雪日”代表冬季的第一天,“深度”列中对应的积雪深度。这是几年的数据(约 62 年)。因此,下雪天列应该有六十二年的第一、第二、第三等天——这会在下雪天产生重复:

我添加了一个“行”列以使数据框更加瞬态(我隐约理解为 1:4638 行是每年 75 天在约 62 年中进行的总测量值。现在我想传播它宽的:

我全为零:

我希望它看起来像这样(列由“下雪天”定义,行值是在不同年份记录的特定日期的各种深度 - 例如第 1 天到第 11 天:

我想我在这里基本上遗漏了一些东西——我尝试过通过 drop=TRUE 或 convert = TRUE 工作,输出值要么全为零,要么全是 NA,这取决于我如何修补。此外,data.frame(seasondata) 中的所有值都是整数。有什么想法吗?

0 投票
1 回答
126 浏览

php - 创建更好的随机算法的问题 - 每日点差

我需要一个算法,按照该时间规则的最小/最大百分比将一些数字按百分比分布在一天中,这就是我拥有的 atm:

结果:

任何优化它并使其更“随机”的方法,我都希望能够增加最小、最大规则,但如果我这样做,最终元素会受到影响,并且总是变成 0

Id 实际上是按小时创建它的最佳选择,而不是按小时创建。

0 投票
1 回答
1021 浏览

r - tidyr 中的 spread() 可以跨多个值传播吗?

我正在使用iris数据集,首先,我对该数据集进行了一些操作,并将其制成以下形式

看起来像

我想使用中的spread()函数tidyr使数据集最终看起来像以下格式

我所做的是以下内容:

这使

我尝试将行号添加到“D4”,因为我发现有时该spread()函数会导致出现一些错误,如此所述。我不知道是否有一种巧妙的方法可以spread()用来实现这个目标。

0 投票
0 回答
52 浏览

r - 从长到宽传播数据

我正在努力理解如何使用 tidyr 的传播功能从长数据格式变为宽数据格式。假设我有以下数据集:

看起来像,

我想将其折叠成以下格式:

如果我理解语法,我相信这很简单。spread(site, numbers.one) 为 numbers.one 值生成 S1 和 S2 列,但不是 numbers.two (加上每年的多行和 NAs 作为填充符),我看不到如何指定要传播的多列。我是不是漏掉了一个步骤,比如把所有相同的岁月聚集在一起,然后传播?

0 投票
1 回答
225 浏览

r - 庞大的数据框进行传播

我有一个巨大的df,尺寸是(58556185 X 2)

并且唯一用户和唯一页面分别为 100,000 和 50,000 我想将其传播到

我已经使用了这段代码,它适用于小型数据集

但是当适用于巨大的df时,它就出来了Error: cannot allocate vector of size 21626.2 Gb

有什么建议么?谢谢

0 投票
1 回答
96 浏览

docker - Spread 是如何知道在 Kubernetes 中更新镜像的?

我想为 Kubernetes 设置一个 Gitlab CD,我阅读了这篇文章

但是,我想知道,我的 K8 集群如何使用我最新的 Docker 镜像进行更新?

例如,在我的.gitlab-ci.yaml文件中,我将有一个最终更新我的云 Docker 映像的buildtestrelease阶段。通过按照文章中的说明设置deploy舞台:

rolling-update只要我按照 Spread指定的 K8 资源目录结构设置好我的 K8 资源目录结构, Spread 是否会知道“神奇地”更新我的 K8 集群(可能通过重新拉取所有图像,执行s) ?

0 投票
1 回答
45 浏览

r - 聚类计算教程 - 传播问题

在遵循这个非常有趣的教程(https://rpubs.com/hrbrmstr/customer-segmentation-r)时,我遇到了一个我不太明白的错误。

这是导致消息“错误:输入中不存在值列'n'”的代码段。在 Rstudio 1.0.136 中:

最后一行是造成问题的行。

有人会知道为什么吗?

0 投票
1 回答
5427 浏览

r - tidyr - 分布多列

我正在为网络荟萃分析准备数据,我很难整理列。

如果我有这个初始数据集:

我怎样才能完成另一个?

我真的被困在这一步,我真的很感激一些帮助......

0 投票
1 回答
73 浏览

r - 在 data.tables 上传播值

我是 R 新手,我想知道是否有一个用于传播的库,通过传播我的意思是,例如,如果我有这个 data.table:

我将 15 分配到该V4列:

将调整这些值,使总和现在为 15:

(新值乘以 15/sum(column) --> 15 / 10)

这是我必须做的最简单的例子,这就是为什么我问是否有图书馆。

0 投票
2 回答
79 浏览

r - 如何在使用 spread() 重塑数据框时解决错误

我正在尝试将长数据框转换为宽且带有标记的案例。我旋转它并使用一个临时向量作为标志。它在小型数据集上完美运行:请参阅示例(复制并粘贴到您的 Rstudio),但是当我尝试对真实数据执行此操作时,它会报告错误:

churnTrain3 <- spread(churnTrain, key = "state", value = "temporary", fill = 0) 错误:行 (169, 249), (57, 109), (11, 226) 的标识符重复

结构范围的数据集与进一步处理相关 是否有任何解决此问题的方法。我敢打赌,很多人试图清理数据并解决同样的问题。请帮帮我这是代码: 第一个块“示例”制作小数据集以实现良好的可视化效果 第二个块“真实数据”是来自流失库的数据集的切片部分