问题标签 [data-transform]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
47 浏览

r - 搜索并格式化字符串

这是我在下面的数据,

数据

所以在我的活动描述栏中,我有很多费用。

一些字符串包含诸如费用、费用或什么都没有的模式。

所以首先, 1. 我需要找到名为 charge 的模式并替换为 charge

  1. 但是对于名为集装箱费用和存储费用的 2 项费用,我需要将其命名为费用而不是费用。前任。集装箱费不是集装箱费。

  2. 如果不存在名为 Charge 的模式,我需要在字符串末尾放置费用。

对于问题 1,我在 R 中尝试了以下代码,

但是它将输出中的其他 s 替换为 Ex。收费。我不知道为什么。

对于问题 2 和 3,我不知道如何开始。

谁可以帮我这个事。

0 投票
2 回答
210 浏览

r - R 中的面板数据:获取基于个人的完整数据案例

我正在研究一个不平衡的面板数据集。数据来自游戏,对于user_id记录中的每个用户 ( ),我都有游戏每个级别 ( level) 的数据。由于在游戏推出一段时间后开始记录数据,对于一些用户我没有关于第一关的数据,这就是为什么我想在第一步中将它们扔掉。

我已经尝试了 complete.cases-function,但它只排除了具有缺失值 (NA) 的行,而不排除具有 1 级缺失值的整个用户的数据。

这就是为什么我需要一个代码来排除每个在级别 1 中没有记录的用户(这在我的数据集中意味着他在一个因变量处有一个“NA”,即活动数量)。

更新 #1:数据看起来像这样(感谢 thc):

我现在想从玩家 1 中排除数据,因为他在级别 1 中的得分为 0。

0 投票
0 回答
438 浏览

machine-learning - box-cox变换后是否需要对数据进行缩放

我有个问题。当我使用带有线性核的 SVR 进行回归分析时,我发现依赖项(目标值)不是正态分布的,并且左侧有一条长尾。所以我使用了box-cox转换。那么目标值的可视化是这样的: box-cox变换前后的数据分布

现在数据呈正态分布,但数量越来越大。我的数据集中的大多数变量的范围从 0 到 1。如果我想训练一个表现良好的模型,我是否应该在 box-cox 转换后缩放(例如使用 MinMax Scaler)数据,以缩小差距变量和目标值之间?

0 投票
3 回答
91 浏览

python - 不能把对象变成字符串

我正在使用一个非常简单的数据框。它只有一个功能,但该功能似乎显示为浮点数,即使它说它是一个对象,当我尝试将它用作字符串时它会给我错误。

当我做 dtypes 时,它会转移:

所以我做了:

df['Id'] = df['Id'].astype(str)

但它什么也没做,因为后来我尝试将它用作字符串:

要摆脱字符串的结尾,它会产生错误:

当我使用 rsplit 时,它给出了同样的错误。

有谁知道我做错了什么?

0 投票
1 回答
428 浏览

python - 如何使用 Glue 转换 JSON 数据库列并将其加载到 Redshift

我正在尝试使用 Glue 复制一些生产数据库(RDS mySQL 到 Redshift)。我已经取得了一些成功,但是当涉及到包含 JSON 列的数据库时,我正在苦苦挣扎。理想情况下,我会将 JSON 数组拆分为多个列以方便分析。有没有一种简单的方法可以用 Glue 做到这一点?

如果这看起来很容易,请提前道歉,但我对该工具的了解有限。

0 投票
1 回答
67 浏览

javascript - 数据库数据重新排列/转换的最佳实践?

我有一个 MySQL 数据库,并在我想以不同方式可视化数据的网站上使用 php 检索数据。为此,我还需要转换数据(例如创建总和、过滤等)。

我现在的问题是,这种转换在数据流的哪一步最有意义,尤其是在性能和​​灵活性方面。我不是一个很有经验的程序员,但我认为这些是我的选择:

1.) 在数据库中准备已经提供所需转换数据的视图。

2.) 使用一个 PHP 脚本,以转换的方式选择数据。

3.) 只需SELECT * FROM table在 PHP 中声明并在 json 中加载所有内容,在 js 中读取并将数据转换为所需的版本。

转换数据的最佳实践是什么?

0 投票
1 回答
37 浏览

transform - 将许多变量的值除以它们的平均值

我希望通过将变量中的每个案例除以该变量的平均值来进行数据转换。我的数据集中有 91 个变量。我使用 AGGREGATE 函数创建方法:

这段代码为我提供了同一数据集中每个变量的平均值,但为了将每个案例除以其平均值,我创建了一个新数据集,其中包含一个可以重复自身的命令。问题是从 mean_1 更改为 mean_2 ...... mean_91。

COMPUTE CMD = CONCAT("COMPUTE",RTRIM(Name),".Norm =",RTRIM(Name),"/mean",1,".").

我如何确保在下一行中,数字 1 将变为 2,然后变为 3,依此类推?

0 投票
2 回答
84 浏览

r - r中从列到行的数据转换

我以这种方式有一个数据框

女孩数据框看起来像这样

1954 X2 1955 X3 1956 X4 . . . . . . . n a 5 e 2 j 1 . . . . . . . n b 6 f 4 k 3 . . . . . . . . n c 1 g 6 l 6 . . . . . . . . .n d 2 h 9 m 8 . . . . . . . . . n

我希望数据框看起来像这样

这是一个学校项目,我正在努力转换数据。有人可以帮我解决这个问题吗?

0 投票
1 回答
110 浏览

linear-regression - 因变量/和自变量的不同参数的线性 Box Cox 变换

我已经坚持了很长一段时间。R 中是否有一个命令可以创建一个 Box Cox 线性变换,该变换对于我的自变量和因变量具有不同的 a 参数?

请注意,我不想转换我的变量 pctwht、dfni、aircon、garage、nbath、cook 和 ohare,因为它们是虚拟变量。

如果你能给我提供关于这个问题的见解,谢谢。

0 投票
1 回答
32 浏览

r - Concat 命名向量列表

我试图弄清楚如何转换一个命名列表,其中值也列在命名列表中,其中值是向量中值串联的结果。

我不知道我是否正确或容易地解释,所以请按照示例进行。