问题标签 [multivariate-partition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
computational-geometry - 如何找到 n 维空间中的 k 最近值?
我读过关于 kd-trees 的文章,但是当空间的维度很高时它们效率低下。我有一个值数据库,我想找到查询的某个汉明距离内的值。例如,数据库是一个 32 位数字的列表,我想找到与查询值相差小于 3 位的所有数字。
我在某处听说过 MultiVariate Partition 树,但找不到好的参考。我知道 min-Hash 给出了一个很好的近似值,更好,但我想要一个准确的答案。
algorithm - 算法的想法?随机排序列表,强调多样性
我有一个项目表[ID, ATTR1, ATTR2, ATTR3]
。我想选择大约一半的项目,但尝试获得一个未聚集的随机结果集。换句话说,ATTR1 值、ATTR2 值和 ATTR3 值的分布相当均匀。这不一定代表整个数据,换句话说,总表可能通常集中在某些属性值上,但我想选择一个更多样化的子集。这些属性不是相互关联的,因此 ATTR1 和 ATTR2 之间没有真正的关联。
例如,假设 ATTR1 = "State"。我希望我的子集中的每个行项目都来自不同的州,即使在整个集合中,我的大部分数据都集中在几个州。并且对于其他两个属性也同样如此。(我意识到有些表可能无法做到这一点,但有足够的数据,不太可能没有解决方案)
关于有效算法的任何想法?谢谢!我什至不知道如何搜索这个:)
(顺便说一句,如果这需要对整个集合进行预计算或索引,也可以,只要我能快速抽出随机变化的子集)
r - 如何为 PCoA 的散点图着色
所以我对此很陌生。我需要在以下数据矩阵上运行 PCoA。我能够使用 ADE4、labdsv、Ginko、Aabel 软件运行我的分析。困扰我的是如何对散点图中的标签进行颜色编码。我的矩阵是按顺序排列的存在/不存在矩阵:
我想要的是用红色、蓝色和所有黑色来表示A1
、A2
和。任何帮助将不胜感激。A3
B1
B2
E
c++ - 使用 Boost 从多元正态分布中采样
我可以使用 C++ 中的 Boost 从正态分布中采样。
我现在有一个简单的问题:
如何使用 Boost 函数(正态分布、多阵列...)从多元正态分布(n>2)中采样?
matlab - 比较多元分布
我有一组多变量实例,我需要从这些实例中提取一个有代表性的集合;例如,如果我有 100,000 个多元实例,我想提取 1000 个代表原始分布的实例。我使用拉丁超立方抽样和随机抽样来提取两个代表集,现在我想检查这两个代表集与原始集的相关性有多大。
如果我进一步详细说明;
我有 100,000 个多变量实例(我们称之为 A)
我从“A”派生了两个有代表性的样本(每个集合将有 1000 个实例;我们称这两个集合为 B 和 C)
我想检查“B”和“C”是否保留了原始“A”的分布。
提前非常感谢!
r - 事件 diff_time 修复最后日期发生
我有一些事件由id, var1, var2 and date
.
所需的 diff_time 输出如下:
我需要计算 date1(事件日期)和控制日期 date2 之间的天数差异时间。约束是:
对于event (id,var1,var2)
我需要找到 last.date1 并计算:
dif_time(days) = date2 - last.date1
, 对于每个事件并报告事件的结果。
我没有找到修复的方法last.date1
,因此感谢您的帮助。
matlab - 多元隐马尔可夫模型
如何组合有关相同马尔可夫状态的多个发射光谱?
让我们使用经典的 HMM 示例:
现在,如果我有多个观察序列怎么办。例如:
如何将这两个观察序列组合成一个 HMM?
注意:我想要一种组合方式,x1
以便x2
它们的相互依赖关系也被建模。因此,简单地说x={x1 x2}
会(IMO)不是一个好的解决方案。
具体来说,我想根据 Matlab 的hmmtrain训练一个 HMM :
这只允许我插入一个seq
.
现在假设我有 5 种不同的发射光谱,它们都说明了 HMM 的状态。我该如何处理这种多变量情况?
r - 是否可以对 R 中多个变量的函数进行线性插值?
在实践中,我需要将 R 中已经存在的 approx 函数扩展到多变量情况。类似于 matlab 中的 interp 函数,但在 C 中用 R 编码。
希望有人能帮助我!
r - R中是否有函数interp1的任何多元版本?
我正在寻找一种使用 R 计算多元函数(5 个变量)的线性插值的方法。 akima 包提供了一种在双变量情况下计算线性插值的方法。可以使用函数 interp 在 matlab 中执行多元线性插值,但我想知道是否有办法在 R 中做同样的事情。
希望可以有人帮帮我!谢谢!
kdtree - 为什么需要在 kd-tree 构建中交替维度
我有一个关于在 kd-tree 算法中划分空间的方式的问题。
假设我在平面上有点,具有 (x,y) 坐标。假设当点在同一条线上时,我们不在特定情况下。我在想为什么我们需要交替分割坐标,在一个级别,使用 x 轴,下一个级别,使用 y 轴。如果我们只使用 x 方向来分割空间,那么重要的是,我们总是有一棵二叉树,并且搜索算法总是取 log(n) 的平均值(假设我们有相对平衡良好的树)。
当我通过交替分割方向分割空间时,什么给了我更多?我想知道它是否与多维中的一些一般概率属性有关?