问题标签 [data-transform]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
64 浏览

python - 将名称中带有日期的列转换为Python中的单独行

我已经在 R 中得到了这个问题的答案,想知道如何在 Python 中实现它。

假设我们有一个这样的 pandas DataFrame:

显示如下:

如何将其转换为如下所示:

0 投票
1 回答
23 浏览

machine-learning - 仅适用于数据子集的变量

我正在使用此链接上提供的公共数据集。

它是关于营销的,其中一个变量 ( pdays, numeric) 是指从上一个活动中最后一次联系客户之后经过的天数。

值为 999 的行表示之前未联系过客户。恐怕将其用于 ML 算法会导致错误的结果。

我正在考虑将它们归零。但是我不知道在使用算法之前缩放数据集时如何处理零(我应该考虑零吗?)。

有更好的解决方案吗?

0 投票
2 回答
59 浏览

r - 从长到宽的非分类值重塑

我需要将具有非分类值且值数量不同的日期从长到宽重塑。

数据框示例:

我需要这个:

我不知道如何重塑它,因为值不是分类的,并且并非每个 id 都具有相同数量的值。

所以我想知道如何从长到宽以及从宽到长这样的数据进行重塑。

感谢您的帮助!

0 投票
6 回答
86 浏览

javascript - 从对象数组中删除重复项,但将一个属性保留为数组

我有一个这样的集合:

我想将它分组以获得以下结果:

我有一个解决方案,但我相信它可以以更优雅的方式实现。我只能使用 ramda,但首选香草解决方案。这是我的解决方案:

0 投票
1 回答
89 浏览

r - 从事件级数据创建网络数据

作为网络分析的新手,我正在努力将要绘制的事件级数据集转换为正确的形状。我很感谢任何提示/线索/等。到目前为止,我所做的大致遵循介绍。

有问题的数据集包含政党 Jobbik 组织的事件。由唯一 id ( id) 定义的每个事件都有关联的组织发起人 ( org_names) 及其类型 ( org)。org_1org_2org_names1和之间没有层次结构org_names2

最初,数据集采用宽格式。虽然我不确定这是否是我应该做的,但我要做的第一步是将数据转换为长格式并清理一些字符串。这是读取数据并将其转换为长格式的代码:

在下一步中,我想创建网络数据集。为此,我计算了每个独特组织参与 Jobbik 活动的次数。添加 Jobbik 作为每条边的一侧并用 igraph 绘制数据:

虽然它运行并创建了网络,但它只能让我了解每个独特的组织和 Jobbik 之间的关系,而不是这些不涉及 Jobbik 的组织之间的关系。我意识到错误出在我所做的数据转换中,我应该使用事件级别的信息来计算每个组织对参与组织某事的次数,然后绘制该数据。不幸的是,虽然我不知道如何到达那里。我很感激任何帮助。

0 投票
2 回答
284 浏览

symfony - DateTimePicker 和 Datatransformer,表单渲染不考虑字符串

我在 Symfony 中遇到了一些将 DateTime 转换为字符串的问题。我使用 DataTransformer 来格式化我的日期时间,但在表单中,有一个错误说:“这个值应该是字符串类型”。

这是我的代码:我的实体:Shift.php(仅必要)

我的 ShiftType :

还有我的 DataTransformer :

正如我所说,当我想提交表单时,表单有错误。它说“这个值应该是字符串类型。” 它是由以下原因引起的:

磨损的东西,当我想编辑班次时,Symfony 从数据库中获取日期并将其转换为字符串,没有错误消息。但是当我想保存编辑时,我遇到了同样的问题

请问你能帮帮我吗 ?谢谢

0 投票
1 回答
58 浏览

python - 在列中填充值

如何在 Pandas 中用逗号分隔的前一个值和下一个值填充 NA。

例如:

我有

.

输出:

这在熊猫中怎么可能?

0 投票
2 回答
460 浏览

r - 使用 dplyr 的 _if() 函数,如 mutate_if() 和否定谓词函数

根据的文档dplyr

那么如何使用逆形式呢?我想将所有非数字值转换为字符,所以我想这样做:

但这不起作用。或者只选择所有非数字变量:

也不行。

如何将否定与,和之dplyr类的函数一起使用?mutate_if()select_if()arrange_if()


编辑:这可能会在即将到来的 dplyr 1.0.0: 中解决NEWS.md

0 投票
1 回答
432 浏览

python - 在循环中创建唯一 ID

我有一个数据集,其中一列如下。我想根据以下条件创建一个新列

我知道下面的代码将满足条件 np.where((df['col']==1),((df['col'] != df1['col'].shift(1)).astype(int).cumsum()),0)

但是,如果我将代码放在某个循环中,我不希望cumsum()再次从 1 开始。它最终会创建重复项。我怎样才能克服这个?

是否可以为该特定条件生成随机数?所以如果它在循环内,我仍然会创建随机数而不是重复的

0 投票
2 回答
62 浏览

r - R中的行值到列

我是 R 新手,我正在尝试建立我的第一个回归模型。但是,我正在努力转换我的数据。

我的数据按以下格式组织:

我正在寻找一种方法将我的数据从上面的格式转换为下面的格式:

从概念上讲,我知道我需要遍历每一行,直到我们到达值为 2 的“alt”列。然后,该行中的所有下一个列值都需要作为新列复制到之前的行和从中的行值被复制需要删除。

我研究了在 R 中从长数据集到宽数据集的方法,但我无法将我的数据集转换为我想要的。

鉴于我缺乏编程经验,有人可以帮助我吗?