问题标签 [missing-data]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
kml - 谷歌地球海拔剖面和缺失值
我有一些来自研究飞机的不错的数据,我将它们放入 kml 文件中,如下例所示。如果您检查海拔剖面,您会发现扩展数据绘制得很好。
我的问题:我的数据包含缺失值。如果我尝试用空代替丢失的数据,则扩展数据不会出现在配置文件框架中(您可以删除 gx-value 对中的一个浮点数以查看)。
我的问题是:是否有任何技巧可以让 GoogleEarth 绘制没有缺失值(即中断)的配置文件?或者您是否知道向 GE 开发人员提供反馈的方法?
mysql - 加入/合并两个表,即兴创作/弥补“缺失”的条目
我有两个表,tbl_foo
和tbl_bar
,我想tbl_foo.foo_id = tbl_bar.foo_id
在 on-clause 中加入这些表。但是,对于每个都tbl_bar.baz_id
应该有一行tbl_foo.foo_id
(即使不tbl_bar
存在这样的条目)。我该如何编写这样的查询?
下面有关于架构和我想要的结果的更多信息。
- 编辑:每一行必须有一个
foo_id
andbaz_id
。 - 编辑2:在下面添加
tbl_baz
。
期望的结果
表:tbl_foo
表:tbl_bar
表:tbl_baz
SQL 架构
r - 用最接近的值替换 R 中的 NA
我正在寻找类似于包na.locf()
中的东西zoo
,但不是总是使用以前的非NA
值,而是我想使用最接近的非NA
值。一些示例数据:
替换NA
为na.locf
(3 结转):
并na.locf
设置fromLast
为TRUE
(5 向后进行):
但我希望使用最接近的非NA
值。在我的示例中,这意味着 3 应该向前结转到第一个NA
,而 5 应该倒退到第二个NA
:
我编写了一个解决方案,但想确保我没有重新发明轮子。有什么东西已经漂浮了吗?
仅供参考,我当前的代码如下。也许如果不出意外,有人可以建议如何提高效率。我觉得我缺少一种明显的改进方法:
要回答以下 smci 的问题:
- 不,任何条目都可以是 NA
- 如果都是 NA,请保持原样
- 不,我当前的解决方案默认为左手最近的值,但这没关系
- 这些行通常是几十万个元素,所以理论上上限是几十万。实际上,这里和那里不会超过几个,通常是一个。
更新所以事实证明,我们完全朝着不同的方向前进,但这仍然是一个有趣的讨论。谢谢大家!
r - 将序列与缺失值对齐
我使用的语言是 R,但您不一定需要了解 R 来回答问题。
问题: 我有一个序列可以被认为是基本事实,另一个序列是第一个序列的移位版本,有一些缺失值。我想知道如何对齐两者。
设置
我有一个ground.truth
基本上是一组时间的序列:
想想ground.truth
我正在执行以下操作的时间:
我有第二个序列observations
,它ground.truth
移动了 20% 的值缺失:
如果我绘制这些向量,这就是它的样子(请记住,将这些视为时间):
我试过的。我想:
- 计算班次(
theLag
在我上面的例子中) - 计算一个向量
idx
,使得ground.truth[idx] == observations - theLag
首先,假设我们知道theLag
。注意ground.truth[1]
不一定observations[1]-theLag
。事实上,我们有ground.truth[1] == observations[1+lagI]-theLag
一些lagI
.
为了计算这个,我想我会使用互相关(ccf
函数)。
但是,每当我这样做时,我都会遇到最大的滞后。互相关为 0,意思是ground.truth[1] == observations[1] - theLag
。但是我已经在示例中尝试过这个,我明确地确保它observations[1] - theLag
不是(即修改以确保它没有 1)。 ground.truth[1]
idx_to_keep
这种转变theLag
不应该影响互相关(不是ccf(x,y) == ccf(x,y-constant)
吗?)所以我打算稍后再解决。
不过,也许我误解了,因为observations
它的价值不如ground.truth
? 即使在我设置的更简单的情况下theLag==0
,互相关函数仍然无法识别正确的滞后,这让我相信我正在考虑这个错误。
有没有人有一个通用的方法来解决这个问题,或者知道一些可以提供帮助的 R 函数/包?
非常感谢。
filter - 数值过滤器和缺失值 (Weka)
我正在使用 SMOTE 对我的数据集进行过采样(受类不平衡的影响)。我的一些属性具有整数值,其他属性只有两位小数,但 SMOTE 创建具有许多小数的新实例。所以为了解决这个问题,我想使用 NumericCleaner 过滤器并设置我想要的小数位数。这似乎可行,但我遇到了缺失值的问题。每个缺失值都替换为 0.0 值,我需要使用数据集中的缺失值来评估我的模型。那么如何使用 NumericCleaner(或其他允许舍入值的过滤器)并保留我的缺失值?
replace - 用平均值替换缺失值(Weka)
在 Weka 中有一个名为“ReplaceMissingValues”的过滤器,它允许使用每个属性的平均值替换数据集中的所有缺失值。我想使用属于某个类的值的平均值来替换某个属性的缺失值。例如,在二进制数据集中,我认为使用仅使用属于正类的记录计算的平均值来替换属于正类的记录中属性的缺失值更正确。那么怎么可能实现呢?我们如何仅替换属于某个类的记录的值?
facebook - FB Graph / FQL:当 FB 页面显示位置时,朋友的 Current_location 有时会读取 Null
我试图在 facebook 上提取用户所有朋友的当前位置,并且遇到了一个奇怪的问题,其中一些朋友正在读出 NULL,而我可以在他们的实际 Facebook 页面上看到它说“住在, . " 这个错误的难点在于它只发生在大约 30% 的情况下。在其余情况下,它会提取所有正确信息,这告诉我权限可能设置正确。
具体来说,我使用的 FQL 代码是:
直接向图形发出 javascript 请求时也出现了同样的问题,因此它似乎也不是 FQL 问题。有谁知道为什么 current_location有时可能会失败并报告 NULL,但并非总是如此?
谢谢你。
matlab - KnnImpute Matlab
在 matlab 中有一个名为 KnnImpute 的函数,它允许使用 Knn 算法替换矩阵中的缺失值。查看http://www.mathworks.it/help/toolbox/bioinfo/ref/knnimpute.html我发现它搜索矩阵的列,但我想搜索沿行检查的邻居。是否有允许这样做的功能?我在哪里可以找到 matlab 代码来实现我的需要?
sparse-matrix - 稀疏数据的特征缩放/归一化
我在用稀疏输入数据训练神经网络来解决监督回归问题时遇到问题。当我对输入数据执行平均归一化(减去平均值然后除标准差)时,我得到了很多 NaN 值。我想知道是否有人有处理此类问题的经验。缩放稀疏输入数据的正确方法是什么?
谢谢乔
matrix - Mathematica 减去缺失值的矩阵
在 Mathematica 中,我有一个缺少值的矩阵“a”,并且我有一个与“a”维度相同的矩阵“b”。我想计算 ab 但如果缺少值,我用“NA”表示,我希望它保持为“NA”。你能帮我解决这个问题吗?请注意,“a”的尺寸为 100 万 X300。
谢谢!