我正在尝试对多项 LogisticRegressionWithLBFGS 模型的输出进行一些后处理。模型矩阵在 R 中创建,然后导出到 scala spark 进行模型拟合。
该文档指出存在“标准特征缩放和 L2 正则化”。multinom()
R 包中函数的多项模型的输出{nnet}
清楚地显示为给定结果和基本结果之间的对数赔率。然而,关于如何转换 LogisticRegressionWithLBFGS 的权重以获得一组标准系数的文档中没有足够的详细信息。
术语“标准特征缩放”对不同的人意味着不同的东西。这可能意味着模型矩阵被缩放为 (x - mean(x))/sd(x) 或 (x - min(x))/(max(x) - min(x)) 或一组其他可能性. 此外,权重输出是一串数字,它是可以以不同方式折叠以获得系数矩阵的特征的倍数 - 例如按行、按列或其他任意方式。
如何处理 LogisticRegressionWithLBFGS().weights 的输出以获得一组标准系数,我可以使用原始模型矩阵进行一些后处理、基本推理和预测?