问题标签 [data-transform]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
149 浏览

deep-learning - 如何为时间序列使用变分自动编码器?

我正在使用其他人制作的 MNIST 数据(2D 图像)上的 Variationnal AutoEncoder 示例(http://louistiao.me/posts/implementing-variational-autoencoders-in-keras-beyond-the-quickstart-tutorial/)并更改它可以在音乐上使用它,但我有一个问题。

我选择这个例子是因为作者不使用卷积层,只使用密集层,所以很容易将它用于时间序列。

图像值在区间 [0,1] ( [0,255]/255 ) 中。

音乐值在区间 [-1,1] 内。

所以我改变了音乐值以适应模型:x = (x+1)/ 2 -> [0,1]。

结果:网络没有学习(我的 val_loss 没有减少)。

我不知道为什么 !!!

PS:我尝试将激活relu / sigmoid更改为tanh而不是更改数据。损失在减少,但她是阴性的……我也没有好的结果。

0 投票
2 回答
554 浏览

java - 使用 Java 将 RTF 转换为 XML

我有一个富文本文档(.rtf 或 .doc),其中包含许多需要读取并转换为 XML 或 Json 结构化数据对象的数据元素。这些文档在数据方面具有一定的格式。是否有任何库可用于使用 java 进行转换。有人遇到过这种情况吗?

有没有人试过 Apache POI 或 Apache Tika 转换成 XML

0 投票
1 回答
131 浏览

java - 基于java中数据集时间块的日期保存时间范围

我需要将一个 ArrayList 数据集转换为另一个 ArrayList 数据集。我需要将“原始数据”转换为下面的“需要的结果”。基本上,我有日期和时间的时间块,需要查看哪些数据集在同一日期的同一时间范围内并保存。不幸的是,算法真的不是我的强项。有什么想法吗?

日期是字符串。对不起,如果我之前没有澄清。

这是我的尝试。不幸的是,它不会创建干净的休息时间,只是将不同日期的结束时间归为同一日期。

下面是我用我的 summaryObjects arraylist 方法得到的数据集,这是错误的。

当我回来时会发布更多信息。

0 投票
0 回答
76 浏览

r - 将两侧倾斜的数据转换为 R 中的正态分布

我有一些像下面生成的双边倾斜数据,我不知道如何将其转换为具有正态分布或同方差性。我尝试了几种转换,例如 log、log+1、exponential、sqrt,但似乎没有任何效果。任何帮助将不胜感激。TIA。

数据

0 投票
1 回答
90 浏览

scala - How do I efficiently map keys from one dataset based on values from other dataset

Assuming data frame 1 represents target country and list of source countries and data frame 2 represents the availability for all the countries, find all the pairs from data frame 1 where target country mapping is TRUE and source country mapping is FALSE:

Dataframe 1 (targetId, sourceId):
USA: China, Russia, India, Japan
China: USA, Russia, India
Russia: USA, Japan

Dataframe 2 (id, available):
USA: true
China: false
Russia: true
India: false
Japan: true

Result Dataset should look like:
(USA, China),
(USA, India)

My idea is to first explode the data set1, create new data frame (say, tempDF), add 2 new columns to it: targetAvailable, sourceAvailable and finally filter for targetAvailable = false and sourceAvailable = true to get the desired result data frame.

Below is the snippet of my code:

Calling isAvailable UDF while calculating the resultDF throws me some weird exception. Am I doing something wrong? is there a better / simpler way to do this?

0 投票
2 回答
120 浏览

r - 根据 R 中另一个变量的两年值创建一个变量

看起来很简单,但我在网上找不到答案。我有 1995-2015 年间具有城市特征的面板数据。对于某些变量,我只有 2000 年和 2010 年的数据。因此,我想创建新变量,在其中将 1995-2004 年的缺失数据与 2000 年的值和 2005-2015 年的缺失数据与 2010 年的值进行估算。

我的数据集看起来像这个例子:

我想要一个像这样的数据集:

欢迎任何帮助。

0 投票
1 回答
195 浏览

machine-learning - 了解应用 MinMaxScaler 后的百分比变化效果?

我想知道在使用 scikitlearn 的 MinMaxScaler 缩放数据后,两个值之间的百分比变化是否保持不变。

如果不是,我应该使用哪种缩放方法来确保缩放后百分比变化保持不变?

0 投票
1 回答
27 浏览

sql - 自动将电子表格单元格复制到以下行

这困扰了我大约一个月。我有一个非常混乱的调度工具导出,它以人类可读但很难查询的方式返回事件和时间。

这是导出的简化部分:

在此处输入图像描述

要将这些数据导入数据库,我手动将名称复制到它下面的每一行,直到找到下一个名称(拖动复制。这需要很长时间,因为导出包含大约 90 人,每人 10-15 行。

我可以查询的结果数据如下所示:

在此处输入图像描述

我的查询涉及删除我不需要的行并整理所有内容,但我真的不确定如何自动获取每一行的名称。

有什么建议么?

0 投票
2 回答
213 浏览

r - 在 R 中使用 if else 条件创建新变量

我知道有很多这样的查询,但我尝试了不同的方法,但我无法解决我的问题:

所以我有一个带有投票百分比的数据集,但它们对不同的公投的定义不同,我想创建一个新列,如果满足条件,则它是变量值之间的差异,或者如果条件满足,则只保留该变量的值没见过。基本上,对于某些公投来说,它会保持它所拥有的百分比值,而其他人则要计算 100 和它现在所拥有的价值之间的差异。像这样的东西:

我试过这个,例如:

和:

还有很多类似的事情,但我不断为所有行打印差异(100-yes.perc),无论它们是否满足条件。我还尝试将“ref.code”变量更改为因子或数字,但没有太大区别。谢谢!

0 投票
1 回答
1611 浏览

azure - Azure 数据工厂/聚合为逗号分隔的字符串

我想使用Aggregate.

这是场景:

我有一个表,其值如下:

执行聚合后,我希望输出如下:

我试图找到String_AggADF 中没有的功能。