问题标签 [standardized]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 如何获得标准化的拟合值
我知道如何在 r 中获得拟合值
但是我想获得标准化的拟合值。我使用“lm.beta”包获得标准化系数。
之后我使用
但我无法获得标准化的预测值。我只是得到非标准化的预测值。
如何在 R 中获得标准化拟合值?
如果您知道某事,请回复我。谢谢!!!
python - 如何按行标准化矩阵(轴= 1)?
对于二维数组,我正在尝试创建一个标准化函数,它应该按行和按列工作。我不确定当使用axis = 1(按行)给出参数时该怎么做。
我试图在这部分更改axis
为:axis = 1
(x - x.mean(axis)) / x.std(axis)
但后来我收到以下错误:
由于我还是初学者,有人可以向我解释该怎么做吗?
normalization - 调查响应与支出之间的相关性
我目前正在研究一个问题,在该问题中我有调查响应,这是由市场研究机构进行的一项调查。该调查衡量了对产品服务覆盖率的看法。调查规模:0-100。样本大小 4K。
手头的任务是找出受访者的调查反应与他们在公司的支出之间的相关性,也就是说,高感知客户的支出高,反之亦然。
我的做法:
由于规模很大,我首先将其缩小到1-10,即1中的0-10%,2中的11-20%......等等。然后我在新的规模和支出上使用了单变量线性回归。
缩放后,我将调查规模视为连续的。
问题:
1) 处理比例(缩放到 1 -10 后)连续的假设是对还是错?
2)是否需要规范化?当我对数据进行标准化时,系数不能被解释为对商务人士更有意义的美元值。如果我在不进行归一化的情况下运行分析会有什么影响?
3)另外,如果一个是调查响应,另一个是支出,那么这里的标准化是否正确?
r - R标准化数据框中的数字变量,同时保留因子变量
我在 R 中加载了一个数据框(dcc),我已将其范围缩小到完整的案例。
我想通过减去平均值并除以标准偏差来标准化数字和整数变量。当我应用以下代码时,我无意中从数据框中删除了因子变量 APPL_SITE_NONSITE:
如果我没记错的话,那是因为该变量的 ind=FALSE。似乎我需要一些 for 循环和 if/else 语句的组合来标准化数字变量并单独保留因子变量。我尝试了许多排列,但不断出错。例如,下面的代码:
返回错误:
match.fun(FUN) 中的错误:c("'if (is.numeric(dcc[, i]) == TRUE) {' 不是函数、字符或符号", "' function(x) (x - mean(x))/sd(x)' 不是函数、字符或符号", "'} else {' 不是函数、字符或符号", "' dcc[, i]' 不是函数,字符或符号", "'}' 不是函数、字符或符号")
也许这是一个简单的格式错误或放错位置的括号,但我完全被卡住了。如果有更优雅的方法可以做到这一点,我愿意接受其他方法。任何帮助将非常感激。
r - 创建标准化多个变量并创建新列的 r 函数
我有一个数据集,我在其中处理许多变量的均值中心和标准化版本。在我的 r 代码中,我有一个为所有变量运行的 scale() 函数的大列表,但我想知道是否有一种方法可以编写一个简单的函数来优化这个过程。
例如:而不是像这样的巨大列表......
有没有办法编写一个函数来创建新向量并根据我指定要标准化的变量将它们附加到数据框的末尾?
我在网上找到了这个例子:
哪个接近但它不能解决创建新向量并将它们附加到我现有数据集的末尾的问题。理想情况下,我希望这样我唯一需要更改的是 center.scale() 函数中的变量名称。谢谢!
python - 标准化 Python Pandas 数据框中的某些列?
下面的 Python 代码只返回一个数组,但我希望缩放数据替换原始数据。
输出
原始数据
merge - 将 t 分数添加到 sas 中的现有数据集
如何在 SAS 的现有数据集中添加带有分数的新变量?
我想在原始数据集中创建一个新变量 age_t ,每个观察的 t 分数
python - Why two different normalized results from Python vs R
Can anyone explain the math behind the scenes? why Python and R return me the different result? which one should I use for real-world business scenario?
original data
Python code:
Python normalized result
and R code
R normalized result
thanks @Wen
r - 如何标准化面板数据框中的选定列
当数据框是面板时,如何标准化数据框中的 SELECTED 列?可以说,我只想通过在下面的示例数据框中显式选择列 X2、X4、X6、X7 和 X9 来标准化列,同时考虑面板数据结构。
可以肯定的是:标准化我的意思是通常减去平均值并除以标准偏差程序。
java - Java Weka - 如何标准化单个实例
我需要实现一个 Weka 分类器,在处理之前对输入数据进行标准化。我为此使用以下代码:
现在,要对单个 Instance 进行分类,我还需要在使用相同的Standardize
过滤器进行实际分类之前对其进行标准化。但Filter.useFilter
只接受Instances
作为参数 - 而不是Instance
.
我该怎么做?或者我应该实现自己的标准化程序?