问题标签 [spread]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
107 浏览

r - 如何将 R 中的列名作为嵌套函数的参数传递给函数

我看到很多关于这方面的问题,但在我的特殊情况下没有任何作用。我正在构建将某些列从长到宽旋转的功能。它传播因子,以便它们可以转换为整数(标志)。在里面我使用函数spread()来获取要传播的列的名称。我尝试了所有我能找到的组合,但没有任何效果。这个函数将是可重用的,并且可以一次性旋转不同的列。所以传递列名是必不可少的。

这是我尝试过的许多不起作用的技巧之一:key = dataFrame[, columnName]inside of spread(). (函数体的最后一行)

这是功能代码:

如果有人想使用此功能,则需要添加具有唯一值的虚拟列,否则某些观察结果将作为重复项被删除。操作后可以拆下柱子。(我是在清洗开始的时候做,最后拆掉)。

0 投票
2 回答
100 浏览

r - 将列名传递给R中的函数时出现神秘错误

我正在创建一个函数,它通过数据框压缩并将factor变量传播到新的虚拟变量,因为某些机器学习算法无法处理因子。为此,我使用spread()了清洁功能中的功能。

但是,当我尝试传递需要传播的列的名称时,它会引发错误:

Error: Invalid column specification

这是代码:

当然,如果我用它替换key = as.character(substitute(name))它就key = "state"可以了,但是整个函数就失去了可重用性。

如何将列名传递给内部函数而不会出错?

0 投票
1 回答
42 浏览

r - 如何使用 spread() 来获得所需的输出

假设,我有一个如下
df1 的数据框:

我想获得一个结果,它将以以下格式提供类型的 Top 2 值(逐点):

输出:

我用过:

但我得到以下答案:

输出:

0 投票
2 回答
1191 浏览

r - tidyr::spread() 函数抛出错误

我尝试在 tidyverse 包中使用收集和传播函数,但它在传播函数中引发错误

图书馆(插入符号)

下面的代码会引发类似这样的错误 Error: Duplicate identifiers for rows

0 投票
1 回答
51 浏览

r - 如何将具有不同类别级别的多个列转换为宽格式?

我有以下一组数据,其中包含多个对应的列:prompt1 与 value1,prompt2 与 value2,promptn 到 valuen。每个提示最多包含 3 个不同级别的类别。

所需的数据框将是:

我试过从 tidyr 传播但没有成功

0 投票
1 回答
479 浏览

r - 在嵌套数据框上执行传播

我想spread在嵌套数据框上执行,但无法解决。这是一个用于普通数据框的玩具数据spread框:

这是嵌套数据框的玩具示例以及我尝试过的(但不起作用):

谢谢你的帮助!

0 投票
1 回答
1148 浏览

python - python pandas pivot:如何进行适当的类似tidyr的传播?

我错过了在 Python 中从长到宽的自发且轻松的转换,反之亦然。想象一下,我有一个大而整洁的数据框,其中包含很多属性列和一个包含所有实际值的列,例如

通过保持整洁,数据本身得到了很好的处理。但有时我必须对某些属性执行一些操作(例如,比较蜜蜂红色和绿色蜜蜂可能很有趣(对于与其他属性相似的所有项目))。因此,直截了当的方法是尽可能保持整洁,并且只打乱我感兴趣的某些属性(PropA)。随后,我可以使用我想要的任何函数执行逐行映射,并且可以创建一个包含函数输出的附加 PropA-Entry。

然而,在 Python 中保持所有其他属性整洁并不像我过去使用 R 那样容易。原因是,所有非关键属性都通过我找到的所有 pd 方法提交给索引。如果我想保留更多的专栏,那将是一团糟。

那么你如何处理这个问题。有没有其他巧妙的方法来处理这些类型的问题?


我自己写了一个传播方法,但是速度非常慢。也许,您对我如何改进有一些想法。

0 投票
0 回答
1319 浏览

r - 根据每日最高价和最低价估算买卖价差(CORWIN & SCHULTZ, 2012)——解释问题

我正在尝试根据每日高价和低价计算买卖价差。CORWIN & SCHULTZ (2012) ( http://onlinelibrary.wiley.com/doi/10.1111/j.1540-6261.2012.01729.x/abstract ) 提出了论文和算法。

这是他们在 SAS 中的实现:https ://www3.nd.edu/~scorwin/HILOW_Estimator_Sample_002.sas

这是我对 R 的翻译:

我现在遇到的问题是,对于一些罕见的异常值,我得到的点差 > 1(我正在将该算法应用于美国的市政债券数据)。我做错了吗?或者我该如何解释它?

非常感谢你的帮助!

0 投票
0 回答
731 浏览

r - tidyr::spread() 给出错误

解决了

请帮助找出以下示例可能有什么问题。

一个问题在这里:

它给出了以下错误:

matrixToDataFrame(x) 中的错误:找不到对象“_tibble_matrixToDataFrame”

到目前为止,我还没有更新软件包:

eipi10 的会话信息:

更新:[感谢@aosmith]tidyverse在新的会话中重新安装有帮助。

0 投票
1 回答
6833 浏览

r - 找不到“传播”功能

所以目前我正试图弄清楚如何从 MovieLense(https://grouplens.org/datasets/movielens/100k/)构建一个电影推荐系统。我从教程中阅读了一些说明。

解释:V1is userid, V2is itemid, V3is rating

现在我需要将格式记录到 ratingMatrix,结果将是这样的:

代码:

传播错误(。,V2,V3):找不到函数“传播”