问题标签 [chi-squared]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - C++ 中的卡方概率函数
我的以下代码使用卡方的“分位数”和 Boost 的概率函数计算置信区间。
我正在尝试实现此功能以避免对 Boost 的依赖。有什么资源可以在哪里找到这样的实现?
r - R中的卡方检验是否有成对的事后比较?
我想知道 R 中是否存在执行以下操作的包/函数:“比例同质性卡方检验的事后成对比较”(或等效项),此处描述: http:// epm.sagepub.com/cgi/content/abstract/53/4/951
我的情况只是在 2 x X 矩阵上进行 chi 测试。我发现了一个差异,但我想知道哪些列对差异“负责”。
谢谢, 塔尔
c# - c#的卡方分布?
我想在 C# 中创建一个实现卡方分布的算法。我
我在互联网上找到了一堆实现,但它们都使用了很多框架,我希望在学校的项目中使用更简单的东西。
如何才能做到这一点?
python - 问题理解卡方特征选择
我一直在理解卡方特征选择方面遇到问题。我有两个类,正面和负面,每个包含不同的术语和术语计数。我需要执行卡方特征选择来为每个类提取最具代表性的术语。问题是我最终得到了我的正面和负面课程完全相同的术语。这是我用于选择功能的 Python 代码:
这就是我使用该类的方式(为简洁起见,省略了一些代码,是的,我已经检查以确保两个语料库不包含完全相同的数据。
我觉得错误来自我计算术语/文档表时,但我不确定。也许我不明白一些事情。有人可以指出我正确的方向吗?
r - 在 R 中使用 chisq.test(卡方检验)
我正在尝试读取一个 csv 文件,然后从 csv 文件的每一行中创建 3 个矩阵,然后使用该方法应用卡方检验chisq.test(matrix)
,但不知何故,这种方法似乎失败了。
它给了我以下错误:
sum(x) 中的错误:参数的“类型”(列表)无效
另一方面,如果我只是创建一个传递一些数字的矩阵,那么它就可以正常工作。我还尝试str
在两种类型的矩阵上运行。
我使用 csv 文件中的行创建的。
/li>str
这给出了:使用一些数字创建的矩阵。
/li>str
这给出了:
有人可以告诉我这里发生了什么吗?
r - 在 R 中使用 for 循环进行卡方分析
我正在尝试对数据中的所有变量组合进行卡方分析,我的代码是:
我的代码给出了变量 1 与变量 3 和变量 2 与变量 3 的卡方分析输出,而变量 1 与变量 2 则缺失。我努力尝试但无法修复代码。任何意见和建议将不胜感激。我想对所有可能的组合进行交叉制表。提前致谢。
编辑
我以前在 SPSS 中做这种分析,但现在我想切换到 R。
r - 每行在 data.frame 内的拟合优度
我有很长的一组频率(超过 70 行是位置)与智利沿岸不同螃蟹种群的性别比有关。这种性别比例从北到南从 1:1 变化的臀部变化,所以我有两列频率,我想确定从哪里开始变化。所以为了做到这一点,我有一个适合度测试。我的想法是在数据框上放置一些预期的概率,这样我就可以对存在显着差异的行进行子集化,并在这些人群中进行一些测试。
我想计算 Chi.Square 和 p.value (df=1) 将这些信息添加到新列中,因为每行都有 4 个元素来执行 2x2 列联表。
我试图按每一行来做,但我对如何将每个值分配给列联表感到困惑。
r - 依赖矩阵
我需要用我的数据集的所有 91 个变量构建一个依赖矩阵。
我尝试使用一些代码,但没有成功。
在这里,您是重要代码的一部分:
它应该创建一个包含所有变量的平方矩阵
它应该关联“p”变量以分析它们是否相互依赖
chisquare
#所有单元格(除非在最后一列中似乎具有p值)按行具有相同的值
我还尝试了另一种方法,这是由比我更了解如何管理 R 的人提供的:
列在第 5 个变量处停止,而我需要检查所有变量之间的依赖关系。每一个。
我不明白我错在哪里,但我希望我不是那么远......
希望能得到很好的帮助,拜托。
r - 比较组均值与卡方
我想看看我的数据中组间的差异是否具有统计学意义。
如何使用这样的长格式数据运行卡方检验
我不知道如何对同一个变量但针对不同的组(国家)运行卡方检验。
谢谢
python - scikit learn:未选择所需数量的最佳特征(k)
我正在尝试使用卡方(scikit-learn 0.10)选择最佳功能。从总共 80 个训练文档中,我首先提取 227 个特征,然后从这 227 个特征中选择前 10 个。
结果如下。
k
如果我设置为 ,它们是相似的100
。
为什么会这样?
*编辑:一个完整的输出示例,现在没有剪辑,我请求 30 并得到 32 代替:
另一个没有剪裁的例子,我请求 10 并得到 11: