问题标签 [statistical-test]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
16 浏览

r - 难以确定如何测试 Bulk RNA 测序数据的变异性

我有一些批量 RNA 测序数据,需要对其进行差异表达显着性测试。我有两个条件,WT 和 KO,每个有两个重复,给我一个如下所示的数据框(列是计数):

我的问题是,如何在右侧获得每个基因的 p 值列,以便构建数据的火山图?基本上,我需要使用什么统计测试来生成该列,以及我在 R 中使用什么函数来做到这一点?如果这在技术上不是我应该在这里问的问题,我很抱歉,但坦率地说,我不知道还能在哪里发帖。提前致谢!

0 投票
0 回答
116 浏览

python-3.x - 如何对两个离散的归一化概率分布函数应用 KS 检验?

想象有一个球形体积,里面装满了不同大小的黑色球体。在投影中,有一些被这些球体相交的蓝色区域。蓝色误差条来自与蓝色区域(投影中)相交的球体的概率分布,而黑色误差条来自与随机光束相交的球体的概率分布。下图显示了两个归一化和离散的概率密度函数。如何使用KS方法或任何其他方法显示蓝色PDF是从黑色PDF中获取的?

在此处输入图像描述

0 投票
0 回答
44 浏览

statistical-test - What statistical test should I use?

I have 2 groups data which I'm trying to compare.

Neither are normally distributed.

My dependant variable is weight in pounds. My independent variable is interaction with a mirror measured in number of visits to the mirror in a 10 minute period.

My sample size is 18.

I cannot, for the life of me, figure out what statistical test to do.

Thanks!

0 投票
1 回答
1490 浏览

python - pandas汇总统计的均值测试差异?

我希望对两个 DataFrame 的汇总统计数据进行均值测试。

我正在寻找一些可以调用这些汇总统计数据的函数,以告诉我我的均值差异是否具有统计显着性。

0 投票
0 回答
130 浏览

c++ - Anderson Darling C++ 实现

我已经尝试在 C++中实现大量时间(哈哈)Anderson-Darling正态性测试。这是我的代码。我知道这里有类似的话题但不幸的是它并没有解决我的问题。

方差计算得当,我猜也是均匀的标准化分布。问题是 b 和 c 为我的样本数据 1、2....10 提供了 NAN。

您知道公式中的错误在哪里吗? Anderson_Darling() 请参见下面的代码?

为了更清晰,代码从类中删除。我没有在这里放明显的方法,比如 mean() 等。

更新- 我将 b 和 c 更改为此,我得到了我期望的输出。

0 投票
0 回答
28 浏览

amazon-web-services - 根据权威数据库验证美国邮寄地址

我有以下业务要求,可以使用他/她提供的姓名和邮寄地址在 Web 服务上对用户进行身份验证:

以下是要求:

  1. 要求用户提供他/她的名字和姓氏,
  2. 如果是,则在权威的私人数据库中查找完全匹配
  3. 要求用户提供他们的邮寄地址
  4. 在权威数据库中查找使用名字,姓氏完全匹配的邮寄地址,如果是的话
  5. 计算用户提供的地址是否与提取的数据库匹配的统计概率(值介于 0(绝对不)、1(完全匹配)之间)
  6. 80% 的概率分数应被视为“用户认证”

我在满足要求#5 和#6 方面面临挑战。

我在这里搜索了一些帖子。尽管有很多关于邮寄地址验证的问题,但恕我直言,没有一个完全符合这些要求。例如,我看到一些帖子通过调用特定的 API 来验证用户输入的邮件地址是否符合 Google、Yahoo 和 USPS 提供的 Web 服务。就我而言,权威数据库是作为私有数据库提供的。然后我们要满足概率分数要求#6。

是否有一个现有的网络服务,我可以传递两个字符串,都采用美国邮寄地址的格式,并返回描述的匹配概率?在更一般的意义上,传递任何两个字符串(例如名称)并返回相同的?有没有其他人有类似的要求,你是如何满足的?我今天简要地查看了 AWS 和 Google Cloud Service,并没有看到明确的实施路径。

提前感谢您的任何帮助。

0 投票
1 回答
228 浏览

r - 有什么方法可以根据 R 中的 wilcoxon 测试选择单变量特征?

我打算用来care::sbf做单变量特征选择,我的输入是具有多个变量(又名,它的列)、候选特征列表和标签(又名,分类变量)的数据框。阅读caret包文档后,我尝试使用sbf,sbfController进行功能选择,但在下面遇到错误:

contrasts<-( , value = contr.funs *tmp*[1 + isOF[nn]]) 中的错误:
对比只能应用于具有 2 个或更多级别的因子

谁能指出我如何解决这个错误?caret::sbf使用什么来做特征选择是正确的?任何想法?

可重现的例子

这是关于公共要点的可重现示例,我将其用作输入。

我目前的尝试

我用谷歌搜索了这个错误,但仍然无法克服它。任何想法使上述代码工作?使用 进行过滤器选择的正确方法是什么caret::sbf

我想要的是输出数据框必须具有附加的 p 值的选定功能。所以这是我的尝试:

预期输出

我期待具有选定特征的输出数据框,其中返回的 p 值wilcox.test应附加到相应的特征。有什么想法可以在 r 中实现吗?如何caret::sbf正确操作特征选择?任何想法?

这是我的 R 会话信息:

0 投票
1 回答
96 浏览

python - 提高 scipy 的 Anderson-Darling 2 样本测试的性能

我需要对两个一维样本应用数十万次Anderson-Darling 检验。中的实现scipyanderson_ksamp,它运行良好,但它占用了相当多的时间。我想提高它的性能,因为我知道:

  1. 我总是会比较 2 个样本
  2. 我只需要 Anderson-Darling 检验统计量,即不需要临界值或 p 值

scipy从测试的原始实现中删除了非必要的检查,我设法将性能提高了近 30%。

这可以进一步改善吗?

0 投票
0 回答
21 浏览

r - R - 测试误差项是否同方差和进一步的相关点

我通常使用 VBA 编程并学习工商管理。但是现在我在 R 中有一项任务,并且在以下 3 点上面临很大挑战,希望能得到一些帮助:

  1. 检验误差项是否同方差。
  2. 使用对异方差具有稳健性的标准误差来检验解释变量是否单独显着。
  3. 对模型的正确规格使用适当的测试。

我如何在 R 中提供这样的问题?

非常感谢你们!

0 投票
1 回答
24 浏览

r - 使用 R 进行多变量统计分析。当行和列都是组时如何查看显着差异(分类排序)

我的数据如下所示,DFD 是我的数据框。

以下是我如何获得每个工作代码遭受低、高和中 BP 的百分比,如下所示。

我想问一下我如何以及通过哪个统计测试可以分别看到所有三个 bp_categories 的三个工作代码之间的显着差异。例如,我想看看工程师在医生和学生中的 Medium_BP 百分比是否显着最高?