问题标签 [pairwise]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
391 浏览

r - Ls 表示在控制其他两个因素时产生相同的 p 值

以前我在使用 lsmeans 识别组之间的显着差异同时使用 lme4 模型控制其他因素时没有任何问题。但是,使用以下数据集查看荧光 lsmeans 会产生相同的 p 值,而不管其他因子水平如何

此示例中使用的数据子集可在此处找到: https ://drive.google.com/file/d/0B3-esLisG8EbTzA3cjVpRGtjREU/view?usp=sharing

数据

响应:此处为 1/0 存在/不存在。(还有平均像素强度和 cbind 百分比覆盖)

固定因素 1:热处理 - 2 级

固定因素 2:竞争待遇 - 2 级

固定因素 3:时间处理 - 2 个级别

随机因素:无

模型创建

最初包含交互项,但根据 AIC 测试,它们的存在并不显着。使用 drop1 对固定因子去除热进行显着性检验很重要

我想测试控制和热处理之间的差异,同时控制竞争处理和时间处理,例如。在 0.5 小时的时间点和没有竞争的对照和加热之间的存在显着不同,在 24 小时的时间点和没有竞争的控制和加热之间的存在显着不同,等等。我尝试了 lsmeans 函数(multcomp 产生类似的结果)

更明确地

对(型号)

但是,两者在每个组组合中都给出相同的 p 值;在查看箱线图和对数据等级进行成对 mann-whitney-U 测试时似乎不准确的东西

我尝试探索数据框以消除相同 p 值的原因。将因子数量减少到两个并使用不同的响应变量/误差分布时,问题仍然很明显。

解决 lsmean/similar 包问题的任何帮助将不胜感激。作为次要选项,关于是否可以接受泊松/二项式 glm()s 的任何建议,然后使用 t-test/mann-whitneys 进行事后测试

0 投票
2 回答
1380 浏览

python - 如何从 DNA 序列中获得比对分数?

我对 Biopython 的 pairwise2 函数有点熟悉,但我注意到它在序列中添加了破折号以获得最佳的对齐分数。例如,

会产生这个结果:

即使第二个序列中的前 2 个字符(A 和 C)与第一个序列对齐。有没有办法找到对齐碱基对的数量而不是对齐碱基对的最高数量(例如:ACTGAA 序列相对于 GCCGTA 序列的得分为 3)?

0 投票
1 回答
1710 浏览

python - pandas.DataFrame 上的成对行操作矩阵

我想在 DataFrame 中的所有行对上创建一个运算结果矩阵。

这是我想要的一个例子:

我已经看到很多解决方案都依赖于计算距离矩阵的现有函数,但我想要更通用的东西。例如,scipy.spatial.distance.pdist执行我想要的格式,但只处理浮点数并且不允许您按名称选择列(或者至少我无法弄清楚如何)。

0 投票
1 回答
47 浏览

python - 如何使用熊猫查看列表 A 的成员是否在列表 B 中

我试图查看一个列表 A 的元素是否在另一个列表 B 中以及在哪个索引上。我知道它们不是熊猫结构。但是应该有一种方法可以使用这些列表来获取示例的结果。如果我错了,请纠正我,我对熊猫更陌生。

例如

然后得到一个结果列表 C

其中 1 表示出现了来自 a 的元素,0 表示没有出现在列表 B 中。

顺便说一句,python 还是新手。我在这里看到了答案, 示例, 但我不知道如何将其应用于我的情况。它建议使用 pandas 函数。

我想探索的选项是使用名为 apply 的函数的选项。该示例表明它要快得多,并且我使用了一个大数据集。

0 投票
4 回答
1205 浏览

python - 两个 numpy 数组到成对数组的数组中

我想从两个不同长度的数组 a 和 b 创建一个成对数组的矩阵:

因此,c 矩阵应如下所示:

0 投票
2 回答
4720 浏览

r - 使用 lsmeans 或 difflsmeans 对 lmer 进行成对比较

我正在做一个阅读实验,比较 4 种条件下 2 组的阅读时间。我运行了一个 lmer 模型,其中阅读条件(因子 w 4 水平)和组(因子 w 2 水平)作为预测变量,注视持续时间作为因变量(数字)。

这是输出的一部分:

我需要进行成对比较,过去我使用过 lsmeans。现在它已被弃用,当我使用 lsmeansLT 时,我收到以下错误消息:

我不明白此错误消息的含义。

我也尝试了 difflsmeans 并且它有效(请参阅下面的示例输出)。但是 difflsmeans 不会更正多重比较的 p 值。

任何人都可以提供解决方案吗?我可以理解并修复 lsmeansLT 的错误,或者以某种方式调整 p 值并继续使用 difflsmeans。(我已经加载了 lsmeans 和 lmerTest 库)谢谢!

0 投票
2 回答
210 浏览

algorithm - 获得具有最大平均距离的点的子集

我有点N。我知道他们的所有成对距离。我需要从中选择K点,以使平均成对距离最大。我只有一个愚蠢的想法来遍历每个点。

您是否有更聪明的想法如何获得这样的子集?

一般地解决这个问题会很好,没有任何假设,但如果有帮助的话:N大约是 10^3-10^4,K大约 10^2。

我的虚拟想法: 我从点#1开始搜索最远的点,所以我有一大块2点,接下来我搜索第三个点,它与这两个点的平均距离最大,依此类推,直到我将收集 K 点。应将所有 N 个点作为起始值重复此过程。最后我会得到 N 个 K 点的数组。我可以从中选择一个平均距离最大的。

0 投票
2 回答
1488 浏览

r - 数据子集的成对方差分析

我需要在 R 中执行多个成对方差分析,并使用 bonferroni 更正 p 值。但是,我不需要将每个 CLASS 相互比较。下面是我的数据格式和selcontrasts:我需要对比 log10relquant 的对。你们中有人知道我该如何执行吗?我使用dplyr,lsmeansbroom包。

目前我正在使用它来配对整个数据集(以便比较每个类)而不是选定的对比:

为了只在列表 x 中选择对比,我尝试了:

但我得到了错误:

0 投票
2 回答
646 浏览

r - 向量元素的所有成对比较的 R-Common 元素

我在 R 中有一个向量,比如 c(2, 2, 3, 2, 3, 4, 4),我想构建一个大小为 n(向量的元素数)的方阵,如果向量的元素 i 与元素 j 具有相同的值,否则为 0。在此示例中,矩阵的元素 [1,2] 和 [1,4] 必须为 1,因为向量的第一个、第二个和第四个元素相同。有没有办法做到这一点 ?要构建的命令或函数?有组合的东西?我想避免像 for 这样的循环。

谢谢 !

0 投票
1 回答
1151 浏览

python - 在熊猫数据框python上应用成对函数

我有一个数据框,我想成对应用我自己的距离。myDistance 需要 2 个数据帧并使用 skelarn pairwise_distance 或 scipy pdist 转换的问题是 ndarray。例子:

这将返回:

然后:

这有效并返回-1。
但这不是,因为 pdist 将 df 行视为 ndarray

IndexError:只有整数、切片 ( :)、省略号 ( ...)、numpy.newaxis ( None) 和整数或布尔数组是有效的索引