问题标签 [statistical-test]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 难以确定如何测试 Bulk RNA 测序数据的变异性
我有一些批量 RNA 测序数据,需要对其进行差异表达显着性测试。我有两个条件,WT 和 KO,每个有两个重复,给我一个如下所示的数据框(列是计数):
我的问题是,如何在右侧获得每个基因的 p 值列,以便构建数据的火山图?基本上,我需要使用什么统计测试来生成该列,以及我在 R 中使用什么函数来做到这一点?如果这在技术上不是我应该在这里问的问题,我很抱歉,但坦率地说,我不知道还能在哪里发帖。提前致谢!
statistical-test - What statistical test should I use?
I have 2 groups data which I'm trying to compare.
Neither are normally distributed.
My dependant variable is weight in pounds. My independent variable is interaction with a mirror measured in number of visits to the mirror in a 10 minute period.
My sample size is 18.
I cannot, for the life of me, figure out what statistical test to do.
Thanks!
python - pandas汇总统计的均值测试差异?
我希望对两个 DataFrame 的汇总统计数据进行均值测试。
我正在寻找一些可以调用这些汇总统计数据的函数,以告诉我我的均值差异是否具有统计显着性。
c++ - Anderson Darling C++ 实现
我已经尝试在 C++中实现大量时间(哈哈)Anderson-Darling正态性测试。这是我的代码。我知道这里有类似的话题,但不幸的是它并没有解决我的问题。
方差计算得当,我猜也是均匀的标准化分布。问题是 b 和 c 为我的样本数据 1、2....10 提供了 NAN。
您知道公式中的错误在哪里吗? Anderson_Darling() 请参见下面的代码?
为了更清晰,代码从类中删除。我没有在这里放明显的方法,比如 mean() 等。
更新- 我将 b 和 c 更改为此,我得到了我期望的输出。
amazon-web-services - 根据权威数据库验证美国邮寄地址
我有以下业务要求,可以使用他/她提供的姓名和邮寄地址在 Web 服务上对用户进行身份验证:
以下是要求:
- 要求用户提供他/她的名字和姓氏,
- 如果是,则在权威的私人数据库中查找完全匹配
- 要求用户提供他们的邮寄地址
- 在权威数据库中查找使用名字,姓氏完全匹配的邮寄地址,如果是的话
- 计算用户提供的地址是否与提取的数据库匹配的统计概率(值介于 0(绝对不)、1(完全匹配)之间)
- 80% 的概率分数应被视为“用户认证”
我在满足要求#5 和#6 方面面临挑战。
我在这里搜索了一些帖子。尽管有很多关于邮寄地址验证的问题,但恕我直言,没有一个完全符合这些要求。例如,我看到一些帖子通过调用特定的 API 来验证用户输入的邮件地址是否符合 Google、Yahoo 和 USPS 提供的 Web 服务。就我而言,权威数据库是作为私有数据库提供的。然后我们要满足概率分数要求#6。
是否有一个现有的网络服务,我可以传递两个字符串,都采用美国邮寄地址的格式,并返回描述的匹配概率?在更一般的意义上,传递任何两个字符串(例如名称)并返回相同的?有没有其他人有类似的要求,你是如何满足的?我今天简要地查看了 AWS 和 Google Cloud Service,并没有看到明确的实施路径。
提前感谢您的任何帮助。
r - 有什么方法可以根据 R 中的 wilcoxon 测试选择单变量特征?
我打算用来care::sbf
做单变量特征选择,我的输入是具有多个变量(又名,它的列)、候选特征列表和标签(又名,分类变量)的数据框。阅读caret
包文档后,我尝试使用sbf
,sbfController
进行功能选择,但在下面遇到错误:
contrasts<-
( , value = contr.funs*tmp*
[1 + isOF[nn]]) 中的错误:
对比只能应用于具有 2 个或更多级别的因子
谁能指出我如何解决这个错误?caret::sbf
使用什么来做特征选择是正确的?任何想法?
可重现的例子:
这是关于公共要点的可重现示例,我将其用作输入。
我目前的尝试:
我用谷歌搜索了这个错误,但仍然无法克服它。任何想法使上述代码工作?使用 进行过滤器选择的正确方法是什么caret::sbf
?
我想要的是输出数据框必须具有附加的 p 值的选定功能。所以这是我的尝试:
预期输出:
我期待具有选定特征的输出数据框,其中返回的 p 值wilcox.test
应附加到相应的特征。有什么想法可以在 r 中实现吗?如何caret::sbf
正确操作特征选择?任何想法?
这是我的 R 会话信息:
python - 提高 scipy 的 Anderson-Darling 2 样本测试的性能
我需要对两个一维样本应用数十万次Anderson-Darling 检验。中的实现scipy
是anderson_ksamp,它运行良好,但它占用了相当多的时间。我想提高它的性能,因为我知道:
- 我总是会比较 2 个样本
- 我只需要 Anderson-Darling 检验统计量,即不需要临界值或 p 值
scipy
从测试的原始实现中删除了非必要的检查,我设法将性能提高了近 30%。
这可以进一步改善吗?
r - R - 测试误差项是否同方差和进一步的相关点
我通常使用 VBA 编程并学习工商管理。但是现在我在 R 中有一项任务,并且在以下 3 点上面临很大挑战,希望能得到一些帮助:
- 检验误差项是否同方差。
- 使用对异方差具有稳健性的标准误差来检验解释变量是否单独显着。
- 对模型的正确规格使用适当的测试。
我如何在 R 中提供这样的问题?
非常感谢你们!
r - 使用 R 进行多变量统计分析。当行和列都是组时如何查看显着差异(分类排序)
我的数据如下所示,DFD 是我的数据框。
以下是我如何获得每个工作代码遭受低、高和中 BP 的百分比,如下所示。
我想问一下我如何以及通过哪个统计测试可以分别看到所有三个 bp_categories 的三个工作代码之间的显着差异。例如,我想看看工程师在医生和学生中的 Medium_BP 百分比是否显着最高?