问题标签 [multivariate-partition]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
607 浏览

computational-geometry - 如何找到 n 维空间中的 k 最近值?

我读过关于 kd-trees 的文章,但是当空间的维度很高时它们效率低下。我有一个值数据库,我想找到查询的某个汉明距离内的值。例如,数据库是一个 32 位数字的列表,我想找到与查询值相差小于 3 位的所有数字。

我在某处听说过 MultiVariate Partition 树,但找不到好的参考。我知道 min-Hash 给出了一个很好的近似值,更好,但我想要一个准确的答案。

0 投票
8 回答
341 浏览

algorithm - 算法的想法?随机排序列表,强调多样性

我有一个项目表[ID, ATTR1, ATTR2, ATTR3]。我想选择大约一半的项目,但尝试获得一个未聚集的随机结果集。换句话说,ATTR1 值、ATTR2 值和 ATTR3 值的分布相当均匀。这不一定代表整个数据,换句话说,总表可能通常集中在某些属性值上,但我想选择一个更多样化的子集。这些属性不是相互关联的,因此 ATTR1 和 ATTR2 之间没有真正的关联。

例如,假设 ATTR1 = "State"。我希望我的子集中的每个行项目都来自不同的州,即使在整个集合中,我的大部分数据都集中在几个州。并且对于其他两个属性也同样如此。(我意识到有些表可能无法做到这一点,但有足够的数据,不太可能没有解决方案)

关于有效算法的任何想法?谢谢!我什至不知道如何搜索这个:)

(顺便说一句,如果这需要对整个集合进行预计算或索引,也可以,只要我能快速抽出随机变化的子集)

0 投票
1 回答
7931 浏览

r - 如何为 PCoA 的散点图着色

所以我对此很陌生。我需要在以下数据矩阵上运行 PCoA。我能够使用 ADE4、labdsv、Ginko、Aabel 软件运行我的分析。困扰我的是如何对散点图中的标签进行颜色编码。我的矩阵是按顺序排列的存在/不存在矩阵:

我想要的是用红色、蓝色和所有黑色来表示A1A2和。任何帮助将不胜感激。A3B1B2E

0 投票
1 回答
2935 浏览

c++ - 使用 Boost 从多元正态分布中采样

我可以使用 C++ 中的 Boost 从正态分布中采样。

我现在有一个简单的问题:

如何使用 Boost 函数(正态分布、多阵列...)从多元正态分布(n>2)中采样?

0 投票
1 回答
2409 浏览

matlab - 比较多元分布

我有一组多变量实例,我需要从这些实例中提取一个有代表性的集合;例如,如果我有 100,000 个多元实例,我想提取 1000 个代表原始分布的实例。我使用拉丁超立方抽样和随机抽样来提取两个代表集,现在我想检查这两个代表集与原始集的相关性有多大。

如果我进一步详细说明;

我有 100,000 个多变量实例(我们称之为 A)

我从“A”派生了两个有代表性的样本(每个集合将有 1000 个实例;我们称这两个集合为 B 和 C)

我想检查“B”和“C”是否保留了原始“A”的分布。

提前非常感谢!

0 投票
1 回答
38 浏览

r - 事件 diff_time 修复最后日期发生

我有一些事件由id, var1, var2 and date.

所需的 diff_time 输出如下:

我需要计算 date1(事件日期)和控制日期 date2 之间的天数差异时间。约束是:

对于event (id,var1,var2)我需要找到 last.date1 并计算:

dif_time(days) = date2 - last.date1, 对于每个事件并报告事件的结果。

我没有找到修复的方法last.date1,因此感谢您的帮助。

0 投票
2 回答
1899 浏览

matlab - 多元隐马尔可夫模型

如何组合有关相同马尔可夫状态的多个发射光谱?

让我们使用经典的 HMM 示例:

现在,如果我有多个观察序列怎么办。例如:

如何将这两个观察序列组合成一个 HMM?

注意:我想要一种组合方式,x1以便x2它们的相互依赖关系也被建模。因此,简单地说x={x1 x2}会(IMO)不是一个好的解决方案。


具体来说,我想根据 Matlab 的hmmtrain训练一个 HMM :

这只允许我插入一个seq.

现在假设我有 5 种不同的发射光谱,它们都说明了 HMM 的状态。我该如何处理这种多变量情况?

0 投票
0 回答
75 浏览

r - 是否可以对 R 中多个变量的函数进行线性插值?

在实践中,我需要将 R 中已经存在的 approx 函数扩展到多变量情况。类似于 matlab 中的 interp 函数,但在 C 中用 R 编码。

希望有人能帮助我!

0 投票
1 回答
1031 浏览

r - R中是否有函数interp1的任何多元版本?

我正在寻找一种使用 R 计算多元函数(5 个变量)的线性插值的方法。 akima 包提供了一种在双变量情况下计算线性插值的方法。可以使用函数 interp 在 matlab 中执行多元线性插值,但我想知道是否有办法在 R 中做同样的事情。

希望可以有人帮帮我!谢谢!

0 投票
1 回答
225 浏览

kdtree - 为什么需要在 kd-tree 构建中交替维度

我有一个关于在 kd-tree 算法中划分空间的方式的问题。

假设我在平面上有点,具有 (x,y) 坐标。假设当点在同一条线上时,我们不在特定情况下。我在想为什么我们需要交替分割坐标,在一个级别,使用 x 轴,下一个级别,使用 y 轴。如果我们只使用 x 方向来分割空间,那么重要的是,我们总是有一棵二叉树,并且搜索算法总是取 log(n) 的平均值(假设我们有相对平衡良好的树)。

当我通过交替分割方向分割空间时,什么给了我更多?我想知道它是否与多维中的一些一般概率属性有关?