问题标签 [data-transform]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
deep-learning - 如何为时间序列使用变分自动编码器?
我正在使用其他人制作的 MNIST 数据(2D 图像)上的 Variationnal AutoEncoder 示例(http://louistiao.me/posts/implementing-variational-autoencoders-in-keras-beyond-the-quickstart-tutorial/)并更改它可以在音乐上使用它,但我有一个问题。
我选择这个例子是因为作者不使用卷积层,只使用密集层,所以很容易将它用于时间序列。
图像值在区间 [0,1] ( [0,255]/255 ) 中。
音乐值在区间 [-1,1] 内。
所以我改变了音乐值以适应模型:x = (x+1)/ 2
-> [0,1]。
结果:网络没有学习(我的 val_loss 没有减少)。
我不知道为什么 !!!
PS:我尝试将激活relu / sigmoid更改为tanh而不是更改数据。损失在减少,但她是阴性的……我也没有好的结果。
java - 使用 Java 将 RTF 转换为 XML
我有一个富文本文档(.rtf 或 .doc),其中包含许多需要读取并转换为 XML 或 Json 结构化数据对象的数据元素。这些文档在数据方面具有一定的格式。是否有任何库可用于使用 java 进行转换。有人遇到过这种情况吗?
有没有人试过 Apache POI 或 Apache Tika 转换成 XML
java - 基于java中数据集时间块的日期保存时间范围
我需要将一个 ArrayList 数据集转换为另一个 ArrayList 数据集。我需要将“原始数据”转换为下面的“需要的结果”。基本上,我有日期和时间的时间块,需要查看哪些数据集在同一日期的同一时间范围内并保存。不幸的是,算法真的不是我的强项。有什么想法吗?
日期是字符串。对不起,如果我之前没有澄清。
这是我的尝试。不幸的是,它不会创建干净的休息时间,只是将不同日期的结束时间归为同一日期。
下面是我用我的 summaryObjects arraylist 方法得到的数据集,这是错误的。
当我回来时会发布更多信息。
scala - How do I efficiently map keys from one dataset based on values from other dataset
Assuming data frame 1 represents target country and list of source countries and data frame 2 represents the availability for all the countries, find all the pairs from data frame 1 where target country mapping is TRUE and source country mapping is FALSE:
Dataframe 1 (targetId, sourceId):
USA: China, Russia, India, Japan
China: USA, Russia, India
Russia: USA, Japan
Dataframe 2 (id, available):
USA: true
China: false
Russia: true
India: false
Japan: true
Result Dataset should look like:
(USA, China),
(USA, India)
My idea is to first explode the data set1, create new data frame (say, tempDF), add 2 new columns to it: targetAvailable, sourceAvailable and finally filter for targetAvailable = false and sourceAvailable = true to get the desired result data frame.
Below is the snippet of my code:
Calling isAvailable
UDF while calculating the resultDF
throws me some weird exception. Am I doing something wrong? is there a better / simpler way to do this?
r - 根据 R 中另一个变量的两年值创建一个变量
看起来很简单,但我在网上找不到答案。我有 1995-2015 年间具有城市特征的面板数据。对于某些变量,我只有 2000 年和 2010 年的数据。因此,我想创建新变量,在其中将 1995-2004 年的缺失数据与 2000 年的值和 2005-2015 年的缺失数据与 2010 年的值进行估算。
我的数据集看起来像这个例子:
我想要一个像这样的数据集:
欢迎任何帮助。
machine-learning - 了解应用 MinMaxScaler 后的百分比变化效果?
我想知道在使用 scikitlearn 的 MinMaxScaler 缩放数据后,两个值之间的百分比变化是否保持不变。
如果不是,我应该使用哪种缩放方法来确保缩放后百分比变化保持不变?
r - 在 R 中使用 if else 条件创建新变量
我知道有很多这样的查询,但我尝试了不同的方法,但我无法解决我的问题:
所以我有一个带有投票百分比的数据集,但它们对不同的公投的定义不同,我想创建一个新列,如果满足条件,则它是变量值之间的差异,或者如果条件满足,则只保留该变量的值没见过。基本上,对于某些公投来说,它会保持它所拥有的百分比值,而其他人则要计算 100 和它现在所拥有的价值之间的差异。像这样的东西:
我试过这个,例如:
和:
还有很多类似的事情,但我不断为所有行打印差异(100-yes.perc),无论它们是否满足条件。我还尝试将“ref.code”变量更改为因子或数字,但没有太大区别。谢谢!
azure - Azure 数据工厂/聚合为逗号分隔的字符串
我想使用Aggregate
.
这是场景:
我有一个表,其值如下:
执行聚合后,我希望输出如下:
我试图找到String_Agg
ADF 中没有的功能。