“statistical-test”的相关标签问题

0 投票

1 回答

16 浏览

r - 难以确定如何测试 Bulk RNA 测序数据的变异性

我有一些批量 RNA 测序数据，需要对其进行差异表达显着性测试。我有两个条件，WT 和 KO，每个有两个重复，给我一个如下所示的数据框（列是计数）：

我的问题是，如何在右侧获得每个基因的 p 值列，以便构建数据的火山图？基本上，我需要使用什么统计测试来生成该列，以及我在 R 中使用什么函数来做到这一点？如果这在技术上不是我应该在这里问的问题，我很抱歉，但坦率地说，我不知道还能在哪里发帖。提前致谢！

r sequencing statistical-test

2020-01-27T16:14:35.397

0 投票

0 回答

116 浏览

python-3.x - 如何对两个离散的归一化概率分布函数应用 KS 检验？

想象有一个球形体积，里面装满了不同大小的黑色球体。在投影中，有一些被这些球体相交的蓝色区域。蓝色误差条来自与蓝色区域（投影中）相交的球体的概率分布，而黑色误差条来自与随机光束相交的球体的概率分布。下图显示了两个归一化和离散的概率密度函数。如何使用KS方法或任何其他方法显示蓝色PDF是从黑色PDF中获取的？

python-3.x distribution statistical-test kolmogorov-smirnov scipy.stats

2020-02-15T23:20:55.583

0 投票

0 回答

44 浏览

statistical-test - What statistical test should I use?

I have 2 groups data which I'm trying to compare.

Neither are normally distributed.

My dependant variable is weight in pounds. My independent variable is interaction with a mirror measured in number of visits to the mirror in a 10 minute period.

My sample size is 18.

I cannot, for the life of me, figure out what statistical test to do.

Thanks!

statistical-test

2020-03-01T11:15:15.830

0 投票

1 回答

1490 浏览

python - pandas汇总统计的均值测试差异？

我希望对两个 DataFrame 的汇总统计数据进行均值测试。

我正在寻找一些可以调用这些汇总统计数据的函数，以告诉我我的均值差异是否具有统计显着性。

python pandas numpy statistical-test

2020-03-02T20:14:19.880

0 投票

0 回答

130 浏览

c++ - Anderson Darling C++ 实现

我已经尝试在 C++中实现大量时间（哈哈）Anderson-Darling正态性测试。这是我的代码。我知道这里有类似的话题，但不幸的是它并没有解决我的问题。

方差计算得当，我猜也是均匀的标准化分布。问题是 b 和 c 为我的样本数据 1、2....10 提供了 NAN。

您知道公式中的错误在哪里吗？ Anderson_Darling() 请参见下面的代码？

为了更清晰，代码从类中删除。我没有在这里放明显的方法，比如 mean() 等。

更新- 我将 b 和 c 更改为此，我得到了我期望的输出。

c++statistics statistical-test

2020-03-12T15:15:41.787

0 投票

0 回答

28 浏览

amazon-web-services - 根据权威数据库验证美国邮寄地址

我有以下业务要求，可以使用他/她提供的姓名和邮寄地址在 Web 服务上对用户进行身份验证：

以下是要求：

要求用户提供他/她的名字和姓氏，
如果是，则在权威的私人数据库中查找完全匹配
要求用户提供他们的邮寄地址
在权威数据库中查找使用名字，姓氏完全匹配的邮寄地址，如果是的话
计算用户提供的地址是否与提取的数据库匹配的统计概率（值介于 0（绝对不）、1（完全匹配）之间）
80% 的概率分数应被视为“用户认证”

我在满足要求#5 和#6 方面面临挑战。

我在这里搜索了一些帖子。尽管有很多关于邮寄地址验证的问题，但恕我直言，没有一个完全符合这些要求。例如，我看到一些帖子通过调用特定的 API 来验证用户输入的邮件地址是否符合 Google、Yahoo 和 USPS 提供的 Web 服务。就我而言，权威数据库是作为私有数据库提供的。然后我们要满足概率分数要求#6。

是否有一个现有的网络服务，我可以传递两个字符串，都采用美国邮寄地址的格式，并返回描述的匹配概率？在更一般的意义上，传递任何两个字符串（例如名称）并返回相同的？有没有其他人有类似的要求，你是如何满足的？我今天简要地查看了 AWS 和 Google Cloud Service，并没有看到明确的实施路径。

提前感谢您的任何帮助。

amazon-web-services google-cloud-platform statistical-test

2020-03-25T18:07:13.243

0 投票

1 回答

228 浏览

r - 有什么方法可以根据 R 中的 wilcoxon 测试选择单变量特征？

我打算用来care::sbf做单变量特征选择，我的输入是具有多个变量（又名，它的列）、候选特征列表和标签（又名，分类变量）的数据框。阅读caret包文档后，我尝试使用sbf,sbfController进行功能选择，但在下面遇到错误：

contrasts<-( , value = contr.funs *tmp*[1 + isOF[nn]]) 中的错误：
对比只能应用于具有 2 个或更多级别的因子

谁能指出我如何解决这个错误？caret::sbf使用什么来做特征选择是正确的？任何想法？

可重现的例子：

这是关于公共要点的可重现示例，我将其用作输入。

我目前的尝试：

我用谷歌搜索了这个错误，但仍然无法克服它。任何想法使上述代码工作？使用进行过滤器选择的正确方法是什么caret::sbf？

我想要的是输出数据框必须具有附加的 p 值的选定功能。所以这是我的尝试：

预期输出：

我期待具有选定特征的输出数据框，其中返回的 p 值wilcox.test应附加到相应的特征。有什么想法可以在 r 中实现吗？如何caret::sbf正确操作特征选择？任何想法？

这是我的 R 会话信息：

r statistics r-caret feature-extraction statistical-test

2020-03-31T14:23:03.663

0 投票

1 回答

96 浏览

python - 提高 scipy 的 Anderson-Darling 2 样本测试的性能

我需要对两个一维样本应用数十万次Anderson-Darling 检验。中的实现scipy是anderson_ksamp，它运行良好，但它占用了相当多的时间。我想提高它的性能，因为我知道：

我总是会比较 2 个样本
我只需要 Anderson-Darling 检验统计量，即不需要临界值或 p 值

scipy从测试的原始实现中删除了非必要的检查，我设法将性能提高了近 30%。

这可以进一步改善吗？

python performance scipy statistical-test

2020-04-07T14:43:41.430

0 投票

0 回答

21 浏览

r - R - 测试误差项是否同方差和进一步的相关点

我通常使用 VBA 编程并学习工商管理。但是现在我在 R 中有一项任务，并且在以下 3 点上面临很大挑战，希望能得到一些帮助：

检验误差项是否同方差。
使用对异方差具有稳健性的标准误差来检验解释变量是否单独显着。
对模型的正确规格使用适当的测试。

我如何在 R 中提供这样的问题？

非常感谢你们！

r statistics statistical-test

2020-04-19T09:19:24.237

0 投票

1 回答

24 浏览

r - 使用 R 进行多变量统计分析。当行和列都是组时如何查看显着差异（分类排序）

我的数据如下所示，DFD 是我的数据框。

以下是我如何获得每个工作代码遭受低、高和中 BP 的百分比，如下所示。

我想问一下我如何以及通过哪个统计测试可以分别看到所有三个 bp_categories 的三个工作代码之间的显着差异。例如，我想看看工程师在医生和学生中的 Medium_BP 百分比是否显着最高？

r dataframe statistics bioinformatics statistical-test

2020-04-19T16:30:25.747

问题标签 [statistical-test]

Reference