问题标签 [multinomial]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 在 R 中将 mlogit 与仅适用于某些替代方案的变量一起使用
我正在尝试在 R 中使用 mlogit 来产生交通方式选择。问题是我有一个仅适用于某些替代方案的变量。
更具体地说,我试图预测使用汽车、公交和非机动交通方式的概率。我的预测因素是:距离、过境等待时间、家庭车辆数量和车辆行驶时间。
当我以这种方式格式化它时它可以工作:
但是,我在车辆行驶时间 (ivt) 中得到的结果没有意义:
如您所见,统计数据看起来不错,但 ivt 应该是负系数而不是正系数。我的想法是,全为 0 的非机动部分正在影响它。我相信我要做的是使用等式的第三部分,如下所示:
但是,这会导致:
我相信这再次是因为对于非机动变量,变量全为 0,但我不确定如何解决这个问题。如果它不适用于所有替代方案,我如何包含替代特定变量?
r - MICE 中的“前导次要 % 不是正确定的”错误
mice
在使用大量数据(30 个分类预测变量和预测变量,
n = 1000)在 R 中运行时,我收到以下错误:
错误
chol.default(fit.sum$cov.unscaled)
:17阶的前导小调不是正定的
我polyreg
对大多数变量使用(多项回归)作为插补方法。由于我不知道为什么会发生此错误,因此我无法发布更多可以重现它的代码。
在 MICE 中使用线性回归时,我在这里发现了一个类似问题的帖子。这篇文章在 Cross Validated 上没有收到任何答案。
如本文所述,这也可能与吉布斯抽样中必要的某些程序有关。OP 在自编程函数中使用 描述了此错误MCMC
,这与 MICE 使用的程序有关。
我不知道什么是领先的未成年人——如果有人能告诉我,也许那将是一个开始。
r - R glmnet:使用多项式和 pmax 时出现分段错误
我使用这个glmnet
包来运行多项套索回归。当使用family="multinomial
具有p
变量和n
样本的数据集pmax=x
时,如果是奇数,则会发生分段错误x
(如果不是pmax>p
。在这种情况下,它很可能被忽略,因为它没有影响)。一个例子:
和错误消息:
我的第一个问题是:为什么?这有数学上的原因吗?(我想是这样...)
第二个是:没有比分段错误更好的解决方案吗?......像警告一样?或者只是使用pmax<-pmax-1
编辑:好的,它似乎有点复杂。有时,只有当我第二次为 pmax 执行相同编号的相同命令时,才会发生分段错误。
另外我发现了这个错误
对于 pmax 的偶数和奇数...
现在它对我来说更像是一个错误......或者?
编辑 2:我在 linux 环境(64 位)中使用 glmnet 1.9-5 运行 R 2.15.2 我还在使用 ubuntu 64 位和 R 3.0.2 的另一台 PC 上遇到分段错误
r - R中的多项逻辑多级模型
问题:我需要估计一组多项逻辑多级模型,但找不到合适的 R 包。估计此类模型的最佳 R 包是什么?STATA 13 最近将此功能添加到他们的多级混合效应模型中——因此估计此类模型的技术似乎是可用的。
细节:许多研究问题需要估计结果变量是分类的多项逻辑回归模型。例如,生物学家可能有兴趣调查哪种树木(例如松树、枫树、橡树)受酸雨的影响最大。市场研究人员可能会对客户年龄与在 Target、Safeway 或 Walmart 购物的频率之间是否存在关系感兴趣。这些案例的共同点是结果变量是分类的(无序的),多项逻辑回归是首选的估计方法。就我而言,我正在调查人类迁移类型的差异,结果变量 (mig) 编码为 0=未迁移,1=内部迁移,2=国际迁移。这是我的数据集的简化版本:
我的目标是估计年龄(自变量)对(1)内部迁移与不迁移,(2)国际迁移与不迁移,(3)内部迁移与国际迁移的几率的影响。另一个复杂因素是我的数据在不同的聚合级别上运行(例如,污染在州一级运行),我也有兴趣预测空气污染(污染)对开展特定类型运动的几率的影响。
笨拙的解决方案:可以通过将每个模型的数据集减少到只有两种迁移类型来估计一组单独的逻辑回归模型(例如,模型 1:只有案例编码 mig=0 和 mig=1;模型 2:只有案例编码 mig=0 和mig=2;模型 3:仅编码为 mig=1 和 mig=2) 的情况。这种简单的多级逻辑回归模型可以用 lme4 进行估计,但这种方法不太理想,因为它没有适当地考虑省略案例的影响。第二种解决方案是使用 R2MLwiN 包在 MLWiN 中通过 R 运行多项逻辑多级模型。但由于 MLWiN 不是开源的并且生成的对象难以使用,我宁愿避免使用此选项。根据全面的互联网搜索,似乎对此类模型有一些需求,但我不知道有一个好的 R 包。因此,如果一些运行过此类模型的专家可以提供建议,并且如果有多个包可能表明一些优点/缺点,那就太好了。我确信这些信息对于多个 R 用户来说将是一个非常有用的资源。谢谢!!
最好的,拉斐尔
distribution - 如何获得因伯努利变量之和的分布
我有 N 个伯努利变量,X1
, ...,XN
和,对于每个,和Xi~B(1, pi)
,都是已知的, 现在我需要得到 的分布。pi
Xi
Y=X1+...XN
Y
如果Xi
和Xj
时 是独立i!=j
的,那么我可以使用模拟:
但是现在Xi
和Xj
是依赖的,所以我还需要考虑相关性,假设什么corr(Xi, Xj)=0.2
时候i!=j
,我怎样才能将相关性插入到模拟中?或者通过其他方式得到 Y 的分布?
感谢您的帮助和建议。
r - 如何在 R 中解释choicemodelr (rhierMnlRwMixture) 的输出
我的问题
我刚开始使用 R 库 'choicemodelr' 并成功获得了一些 beta 值作为解决方案。但我想知道如何将这些值分配给特定的属性级别。结果,我只能得到 A1B1、A1B2、A1B3 等的值。这个通用输出通常如何连接到我的设计?
在文档中没有找到提示。既不是choicemodelr库,也不是它所连接的bayesm库(rhierMnlRwMixture)。我希望你能帮我解决这个问题。
在此先感谢,菲尔
为了说明这一点,一些代码和输出:
我在 R 中的代码
我得到以下输出(摘录):
响应 A1B1 A1B2 A1B3 A1B4 A2B1 A2B2 无
001 -2,56 -6,54 -18,49 27,59 -1,74 1,74 -1,94
002 -3,18 -6,52 -19,79 29, 49 0,50 -0,50 -0,58
希望那条信息有帮助。如果您需要更多信息,请告诉我。
r - 如何在 nnet 包中的 multinom() 中设置特定的对比?
我有一个需要分类的三类问题。我想在nnet
包中使用多项逻辑回归。班级结果有 3 个因素,P、Q、R。我想将 Q 作为基本因素。
所以我试着把它写成这样的对比:
检查了它:
现在multinom()
:
输出:
问题:
如您所见,由于 P 类没有出现在输出中,这意味着在处理 R 中的因子变量时,它被视为按字母顺序排列的第一个基类,而 Q 类没有被视为在这种情况下,基础级别,如何使其以其他两个级别为基础?
r - 如何在 R 中使用带有截距的 multinom() 预测?
我在 R 中运行了 multinom() 函数,但是当我尝试对新样本进行预测时,它不断给出错误。
这是代码:
这是错误:
我认为这与分析中包含的截距有关,但与新的预测输入无关。我尝试通过合并一个 1x1 数据框来手动设置它,该数据框包含一个名为“Intercept”的 1(因为它在 summary() 中被调用),但它仍然给出相同的错误。
r - 多项式混合 logit 模型 mlogit r-package
我发现了多项式 logit 模型的mlogit
-包,以搜索估计多项式混合 logit 模型。在阅读了优秀的小插图后,我发现我无法将我的数据应用于任何描述的示例。
我现在写信希望对我的问题有所帮助,并创建了一个最小的例子来说明我的情况。
问题如下:某处有辅音“Q”的单词。现在进行了一项实验,这些人的任务是听这些单词并说出他们是否听到了 Q、U 或其他辅音。这必须根据音节位置或真实/非真实单词等因素进行建模。
在最小的例子中,我用音节位置创建了 4 个人和他们的答案。
据我所知nnet
的multinom
功能不包括混合模型。
首先,我使用mlogit.data
-function 来重塑文件。在与一位同事讨论后,我们得出的结论是没有替代的具体变量。
不,我不知道该怎么做,所以我在这里寻求帮助。但我相信这种问题可以解决,mlogit
我只是还没有看到;)
r - R,多项回归:如何找到条件概率?
在R
中,给定多项线性 logit 回归,我需要在给定一些预测变量值的情况下获得条件概率。
例如,使用multinom
包中的函数nnet
,想象有计算fit <- multinom(response ~ predictor)
。从fit
,给定预测变量的某个值,如何获得不同响应类别的概率权重?
我想过使用类似的东西predict(fit,newdata,type=???)
,但我不知道如何继续。