问题标签 [multivariate-testing]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
265 浏览

r - PERMANOVA 中超过三个独立的对比

我尝试在 PERMANOVA 中用 4 个因素创建超过三个独立的对比,但没有成功。我需要在我的 contr2df 对象中使用所有可能的因子水平成对组合。有什么办法可以使这成为可能?在我的代码中:

谢谢,

亚历山大

0 投票
0 回答
1008 浏览

r - 使用稳健的马氏距离后去除多元异常值

我有一个包含 3 个变量的 167 个观察值的数据集。我正在尝试使用稳健的马氏距离来评估和消除多元异常值。为此,我一直在使用包中的Moutlier功能chemometrics

我对 R 很陌生,所以我有一些问题:

这是我的代码:

1)以前有人用过这个代码吗,我做对了吗?

2)在做这个功能之前我需要对数据进行标准化,还是没有关系?

3)使用该which函数后,结果为:

这是否意味着这些数字对应于观察 #13、#28、#29 等?
那么对于所有 3 个变量,这些将是我要删除的异常值吗?

非常感谢任何可以提供帮助的人...

0 投票
0 回答
28 浏览

r - 如何创建概述组数据点的二维多边形以及此类欧几里得或超空间体积的重叠分析

我已经使用 ggbiplot 函数构建了一个 PCA 图并添加了置信椭圆(stat_ellipse),但我想创建一个 2d 多边形来勾勒出不同组(由三个湖泊组成)的所有数据点的轮廓,我该怎么做?

这稍后将用于分析三组(湖泊)的欧几里得或超空间“体积”之间的重叠百分比。

df = 相关矩阵

0 投票
1 回答
4128 浏览

r - 在家庭=高斯(身份链接)的 glmer() 中调用错误

我正在尝试为具有 53 个 obs 的数据框修复 glmm。17 个变量。所有变量都是标准化的,但不遵循正态分布且没有缺失值。数据框的 str() 如下所示。

  • 物种:因子 w/ 19 水平“spp1”,“spp2”,..:5 18 12 15 19 4 6 14 16 5 ...
  • 关联:因子 w/ 4 个级别“assoA”,“assoB”,..:1 1 2 2 2 3 3 4 4 1 ...
  • 站点:因子 w/ 2 个级别 "site1","site2": 1 1 1 1 1 1 1 1 1 2 ...
  • obs.no : int 1 1 1 1 1 1 1 1 1 1 ...
  • 特征1:数字0.652 0.428 0.535 0.389 0.486 ...
  • 特征2:数量 0.135 0.16 0.134 0.142 0.159
  • (剪裁 trait3 到 13)

我执行了以下代码来检查站点之间的重要性以及给定特征的关联类。

并收到下面给出的错误。

在 glmer(trait1 ~ association+site+ (1 | species),data=df6, : 不推荐使用 family=gaussian (身份链接) 调用 glmer() 作为 lmer() 的快捷方式;请直接调用 lmer()

在此之后,我想用 Gauss-Hermite 正交估计参数。非常感谢任何修复此错误和执行 Gauss-Hermite 正交的代码的建议。

0 投票
1 回答
931 浏览

r - 多变量和单变量的 Tukey HSD 返回不同的结果

我试图为多变量数据集运行 Tukey HSD。但是,当我对单个变量运行相同的测试时,结果完全相反。

在运行多个变量时,我在 ANOVA 输出中观察到以下错误:

87 个影响中有 8 个不可估计 估计的影响可能不平衡

在为单个变量运行时,我在 ANOVA 输出中观察到以下错误:

估计的影响可能不平衡

这与我收到的完全相反的 Tukey HSD 输出有什么关系吗?另外,我该如何继续解决这个问题?

我使用了 aov() 并且在我的数据集中有接近 500000 个数据点。

更具体地说,以下代码给了我不同的结果:

代码1:

代码2:

请告诉我这是怎么可能的...

0 投票
1 回答
63 浏览

r - 来自 Chen 等人的多单变量荟萃分析的 R 代码,2016 年医学统计;35:1405-22

我正在尝试通过 Chen 等人提供的多个单变量荟萃分析运行示例 R 代码以进行多变量荟萃分析,该文章发表于2016 年医学统计;35:1405-22

不幸的是,示例代码不起作用(下面详细提供)。

关于如何使其顺利运行的任何建议?

0 投票
0 回答
67 浏览

r - R Kullback测试中的多元回归不起作用

冒着这是一个有点模糊的问题的风险,我还是继续问:

我在 R 中运行具有两个结果变量的多元回归,并想评估协方差矩阵的同质性,但是,唉,Kullback 测试会引发错误:

现在,x 和 y 都是矩阵,所以我真的不知道该怎么做,并且会感谢任何类型的输入。

我希望这有助于说明问题。

0 投票
4 回答
2664 浏览

python - 多输入多元数据可视化

我试图通过从多个输入文件中读取多元数据模型来可视化它们。我正在寻找一种简单的解决方案来可视化从多个输入 csv 文件中读取的多个类别数据。没有。单个文件中输入的行数范围从 1 到 10000。具有 4 列 csv 文件的所有输入的格式相同。

输入 1

输入 2

输入 3

输入 4

这四个输入分别属于不同的类别,col[1]并且col[2]是某种分类的配对结果。这里的所有输入都是同一分类的输出。我想以更好的方式将它们可视化,以便仅在一个图中显示所有类别。寻找相同的python或pandas解决方案。散点图或任何最佳的绘图方法。

我已经在堆栈交换的数据分析部分发布了这个查询,但我没有运气,因此在这里尝试。 https://datascience.stackexchange.com/questions/11440/multi-model-data-set-visualization-python

可能如下图所示,其中每个类都有自己的标记和颜色,并且可以进行分类,或者以任何更好的方式一起显示对值。

代码:编辑 1:我正在尝试使用上述输入文件绘制散点图。

错误:

预期输出绘图 - Pandas

散点图

0 投票
1 回答
161 浏览

ab-testing - 确定 A/B 测试的样本量,超过 2 个变体

如果我们想决定这样一个测试的样本量,我们应该使用什么 R 函数:

10 个广告,我们想通过测试来确定哪些广告的点击率最高。我们能够计算流量和点击次数。

0 投票
0 回答
94 浏览

r - 匹配病例对照数据的多变量分析

我是一名医科学生,正在从事一些公共卫生研究。我是论坛的新手,我现在完全被难住了,试图弄清楚如何处理病例对照匹配数据的多变量分析问题。设置是我有 36 个组,每个组有 1 个阳性(病例)和 0 到 4 个阴性(对照)。我已经离开了仅由我的单变量分析中的阳性组成的一组。

在这 36 个组中,24 个为高风险 (1-24),12 个为低风险 (25-36)。我对所有这些小组参与者进行了约 100 个问题的调查。其中一些问题有二元回答,其他问题有多达 6 个回答。

到目前为止,我一直在使用以下脚本对二元方程的单变量分析进行 Mantel-Haenszel 卡方检验:

这对于对二元问题进行单变量分析是有效的,但我不知道如何正确地对具有多个答案的问题进行匹配组的单变量分析(即你最喜欢的颜色是什么:绿色、红色、黄色等) . 有没有办法做到这一点?

然而,我最大的问题是,我怎么可能在 R 中使用这样的匹配数据进行多变量分析?是否有 Mantel-Haenszel 的多元版本?

感谢您的任何帮助。

-一个