问题标签 [multivariate-testing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 使用 r 和 winbug 进行多变量测试
我如何使用多元变量的平均值(ttest)进行差异,R
并且WinBUGS14
我有一个多元结果y
和分类变量x
。我可以MCMC
使用下面的代码从多元变量中获取采样值的均值,但是如何通过变量测试均值的差异x
?
这是R
代码
这是WinBUGS14
代码mult_normal.bug
random-forest - 多变量类的过采样
我正在使用 R 中的随机森林开发一个模型。数据有 2000 个 obs x 20 个特征。我要分类的目标类有 6 个级别。所有变量本质上都是分类的。
目标偏向一个类别,占观察的 65% 以上。其余 35% 分布在其他五个目标类别中。分布如下
我正在尝试使用 ROSE 或 SMOTE 来平衡数据集,但得到一个错误,即它们仅适用于二进制分类器。
R 中是否有可用的库来平衡多类数据集。目前模型的准确率非常低(大约 64%)。我希望平衡数据集可以提高准确性。
对此问题的任何帮助将不胜感激。
干杯-尼丁
r - 查找 R 中多元数据的 T^2 分位数
我有一个具有 2 个变量的分区多元数据集的 T^2 统计量,通过计算配对比较测试找到。我想在不使用表格的情况下将我的 T^2 数字与 T^2_{.95, p, n-1} 值进行比较。
R 中是否有函数或包可以让我找到这些值?
matlab - Matlab - 查找附近的点
假设我有一个如下所示的数据集。
X = [170,85; 165,75; 180,100;190,120; 160,80; 170,70];
距离向量
Y = [10,20];
一个数据点
Z = [166,77];
我想找到 X 点与 Z 点的距离 Y 内的所有点
答案应该是 ans = [170,85; 165,75; 160,80; 170,70]
如何在 Matlab 中做到这一点
r - 使用带有概率的 R 进行多变量异常值检测
我一直在到处寻找使用 R 识别多元异常值的最佳方法,但我认为我还没有找到任何可信的方法。
我们可以以虹膜数据为例,因为我的数据也包含多个字段
首先,我使用与图书馆 MVN 的Mahalanobis 距离
两者都导致了大量的异常值(150 个中的 50 个为未调整的,49/150 个为调整的),我认为这需要更多改进。不幸的是,我似乎无法在 mvOutlier 方法中找到一个变量来设置阈值(说增加一个点成为异常值的概率,以便我们有一个较小的数字)
其次,我使用了异常值库。这是为了找到单变量异常值。所以,我的计划是在数据的每个维度上找到异常值,并且那些在所有维度上都是异常值的点被视为数据集的异常值。
为此我们可以设置概率,但我认为它不能代替多元异常值检测。
我尝试过的其他一些方法
- 库(mvoutlier):这仅显示情节。很难自动找到异常值。而且我不知道如何将概率添加到这个
- 厨师距离(链接):一个人说他使用了厨师距离,但我认为没有任何强有力的学术证据证明这是可以的。
r - r中多变量分析中的异方差检验
我有不同的模型(线性(lm)、gls、GARCH),我想检查它们的异方差性。
然而,对于 lm-model 来说,它非常简单,直观且测试如下:
对于其他模型来说,这并不容易!你有什么想法?
指示性地报告说,我有一个包含 15 个 X 变量和一个因变量 Y 的样本。
r - R指数多元回归
所以我有上面的数据集,我想做的是以a*x^b
. 我试过在 r 上使用 nls 函数,但没有成功。有没有人有关于如何做到这一点的任何提示。基本上方程的最终形式应该是y = a1*x1^b1 + a2*x2^b2 + a3*x3^b3 + a4*x4^b4 + a5*x5^b5
。我需要解决a1,b1,a2,b2,a3,b3,a4,b4,a5,b5
变量。
r - 在 R 中规范化数据
目前我正在学习 QDA 并正在使用 R 软件来分析我的数据。
数据是从以下链接下载的:
https://www.kaggle.com/uciml/pima-indians-diabetes-database
我想检查 QDA 假设,即两组是多元正态分布的,因此在 R 中使用了以下命令。
两组都是非正态分布的,所以我想对数据进行归一化,并编写下面的代码来归一化第一组的数据。
与 group2 类似,但是 group1 的平均向量 X 没有给出接近 0 的结果。
谁能帮助我前进的方向是什么?
r - 多元多元线性回归中解释的增量方差
我尝试计算由多元多元线性回归模型中的变量解释的增量方差,但我没有像多元线性回归那样的平方和参数。我想要类似的东西:
显然行不通。有某种方法可以解决这个问题吗?