问题标签 [multinomial]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R:对非常大的数据集使用 multinom()
我正在尝试使用 multinom 包对我的数据集运行多项逻辑回归。我的数据集有 25029 行和 5735 列,基本上是在做:
我遇到了几个错误,这让我调整了两个选项:
在我的多项功能中。
但是,现在我面临更多警告(运行 30 分钟后):
在计算机内存、内存和所有这些东西方面,我不是专家,我研究了 R 上的一些大数据操作,但我仍然没有真正得到我能做些什么来成功运行这段代码。
任何意见,将不胜感激。
谢谢。
r - 在 R 中使用 mboost 多项逻辑回归进行预测
我正在尝试使用 R 中的 mboost 包来应用多项逻辑回归模型。我在网上找到了这个例子,但我在预测函数中添加了“newdata = iris”,以查看预测公式如何在 mboost 中为新数据工作。但是,我收到一个错误。首先是代码:
我得到的错误如下:(newdata,nm)
中的错误:选择了未定义的列[.data.frame
我只是在预测中重新使用了虹膜数据作为测试,但是以前有人遇到过这个问题吗?
r - 在给定概率的情况下,对具有放回的抽样进行建模
我想在 R 中对带有替换的采样进行建模(如骨灰盒模型)。也就是说,我有三个不同的事件(例如:1,2 和 3(实际上它们是分类的,但我认为目前这并不重要))并且我知道每个事件的概率:
现在我想以 50 个替换样本为例,我想知道三种不同事件的每种可能组合的概率。
我的想法是用来rmultinom
生成这些样本。
现在我得到 50 个随机(?)选择的样本,但是当我取 50 个替换样本时,我需要所有可能的组合。
r - 尝试使用 gmnl 包估计 R 中的 Scale Multinomial logit 模型。
我是 R 新手,我正在尝试从我的数据中估计一个离散选择模型。我在估计我的模型的过程中陷入了困境,希望能得到您的帮助。
我正在使用“gmnl”包来估计 S-MNL(Scale Multinomial Logit)。有四种交通方式作为备选,备选特定变量是“收费”和“时间”。个人特定变量是收入和性别(它们都作为虚拟变量进入模型,收入变量定义为收入 6 个收入组)。
我首先估计了一个 S-MNL,其中替代特定常数是固定的而不是缩放的,这是收敛的。
然后,我允许规模根据个人的收入而有所不同(我在“公式”的第五部分中指定变量收入和无常数都包含在规模中。
但是,我收到以下错误:
H[i, , drop = FALSE] 中的错误:下标超出范围
我不知道为什么我得到这个错误。我尝试了以下论点来找出导致它的原因:
总结期间的错误:承诺已经在评估中:递归默认参数引用或早期问题?
总结期间的错误:承诺已经在评估中:递归默认参数引用或早期问题?
我无法理解问题所在。我认为这可能是因为使用了虚拟变量。请帮我解决问题。谢谢!
r - 可视化多类 ROC 分析
我在 R 中运行多项逻辑回归模型(有 3 个可能的结果)。我试图找到评估模型预测能力/准确性的最佳方法,而我想出的最好的方法是使用 ROC曲线。
对于多类 ROC 分析,我知道有一对一比较或一对一比较。对于一对一的比较,对于结果比较的每种可能组合,我是否需要三个单独的 ROC 曲线?如果是这样,我是否需要制作第三个模型来比较最初与基线结果进行比较的两个结果?
对于一个与所有的比较,ar“随机模型”的阈值现在是 33% 而不是 50%?
最后,有没有更好的方法来做这个/可视化它?
编辑:我知道 pROC 包有一个 multiclass.roc 函数,但我不完全明白它的作用。
r - 如何在函数内的 multinom/nnet 对象上调用 model.frame()?
我正在尝试估计一个 multinom() 模型,然后获取模型 data.frame。
在函数之外,这工作正常。但是当我尝试在函数中这样做时, data.frame() 步骤会引发错误。
下面是应该隔离问题的示例代码:
最后一行产生这个:
当我运行 traceback() 时,我得到了这个:
这是范围界定问题吗?有解决方法吗?
r - R中的排序选择:结果分析
请考虑以下示例数据集:
有 200 人被要求将选项 W 到 Z 从 1 到 4 排名,以降低社区犯罪率的有效性。他们的年龄、最高学历和性别也有注释。我想知道:
- 大多数公民更喜欢哪些选择?
- 男女老幼、受过良好教育的公民的信仰是否存在显着差异?
- 如果此人年龄较大/较年轻、受过或多或少的正规教育并且是男性还是女性,那么排名顺序发生变化的可能性有多大?
我读到多项逻辑回归可能是要走的路,但我发现很难将我找到的示例应用于我的数据集。通常它们只允许选择一个选项,使每个选项(W,XYZ)成为一个变量(选项)的水平。但在我的情况下,我有几个变量(OptionW、OptionX、OptionY、OptionZ),其中排名位置似乎是级别(1、2、3、..10)。还是我看错了?
哪个包中的哪个功能合适?除了多项逻辑回归之外,还有其他可用的方法吗?我可以对 200 个样本进行聚类分析吗?
我主要使用 R 进行空间分析,并且在统计方面不是很流利。希望你能在这里帮助我。
r - 获得提升多项式模型的准确性
我试图找到增强模型的准确性。我的代码是这样的:
当我尝试这个时,我收到以下错误:
我不确定要纠正什么或我做错了什么。有什么建议么?