问题标签 [standardized]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 面板数据上的 PCA?(Python、PCA、Scikit.learn)
数据集如下所示:
- 除了(目前与年份一起索引)之外,所有特征
x
都是数字和缩放的name
我已经应用于StandardScaler
我的整个时间序列数据集。
我现在即将使用
PCA
,但我停下来想知道它是否可以/应该应用于像上面那样的整个时间序列数据集。
- 我刚刚完成了对 PCA 的大量研究,但想不出在时间序列上使用它会有什么不同的原因。
- 我是否忘记了关于时间序列的 PCA 的一些重要内容?
我发现了一些较早提到的功能性 PCA,但这仍然相关/需要吗?还是 SciKit.learn 已经过时了?
r - 使用另一个数据框缩放数据框中的变量
我有一个包含以下变量的数据框
我有一个平均值和 sd 存储以在另一个数据帧中将 x1 标准化为 x6
我想从dat
标准化的 x1 到 x6 创建一个新的数据框。我做了一个循环解决方案
有没有不使用循环的另一种解决方案?
python-3.x - 如何在多元时间序列数据中使用特征缩放?
我正在尝试对多元时间序列数据进行分类。我想对这种数据进行特征缩放。假设多元时间序列数据如下所示:
等等,
我应该如何使用此处的特征缩放将所有特征置于同一范围内?
方法一: 1.对F1中的每个list计算均值和标准差,对数据进行标准化 2.对所有特征中的所有list(F2,F3)重复上述步骤
方法二: 1、计算F1中每个列表的均值,然后计算所有列表的均值,同样计算每个列表的std,对F1中所有列表求平均值。使用这个平均值和标准差来标准化特征 F1 2. 对所有其他特征(F2,F3)重复上述步骤
标准化此类数据的正确方法是什么?上述方法是否正确?
r - 幂函数正态总体
我希望从具有平均 μ 和已知方差 σ² 的正常总体中计算幂函数。
我正在尝试修改“帮助”代码:
对于我的测试,替代值大于 0 (c=0)。我没有平均值和方差的数值。
我还发现了一个函数“power.z.test”,但该包似乎对 R 3.6.1 不可用。
r - 规范化一列包含离散值子集的数据(在 R 中)
我知道这可能是我的重新安排问题,但我无法想象如何最好地做到这一点。
我可以按照其他规范化问题中包含的步骤使用这里和这里,但我的问题是我的数据(粘贴在下面的示例)正在记录各种“变化”指标。所以 SE、SD 等。我对他们测量的内容不感兴趣,也不对网站的数字比较感兴趣。后一点我不知道如何描述,因为我的统计知识很差,我的意思是如果站点 1 的值是 1-10,站点 2 的值是 11-20,我想比较不同类别之间的变异分布(在下面的示例中,它是“Res”、“Un”、“Ref”)。所以我想规范化下面的变量“分数”,但对每个站点单独进行。
我想基本上使用scale(d)
但添加一个类似于group =
绘制图时的参数,以在一列变量中缩放离散组。
我希望这是有道理的,并让我知道是否有任何其他信息可能有用。
r - 这会单独缩放每一列吗?R
如果我想标准化第 2 列和第 3 列(每列分别标准化),这行得通吗?
r - R 中面板数据的标准化 Beta
我有一个面板数据集,并且正在运行固定效果回归。我的因变量是 CDS 价差,我有 7 个自变量,它们是宏观经济变量(GDP、通货膨胀等),然后我有三个机构的评级数据,这是第八个自变量,所以我基本上对每个评级机构运行三个单独的回归:
我想比较三个机构对 CDS 利差的影响幅度差异,以及与其他自变量的比较,但三个机构的评级规模不同。我想标准化系数。我如何为面板数据执行此操作。“QuantPsyc”包中的“lm.beta”没有给出准确的结果。它改变了系数的符号,并且较早的帖子表明不建议对面板数据使用 z 变换。您能否建议一种从结果中进行有意义比较的方法?
谢谢!
normalization - PCA 和 SVD 对相同单位数据的不同结果
一开始,我有 400,000 张经过归一化的图像(灰度值增加)。之后,我对每张图片进行了 DFT,得到了 400000 个样本的数据,具有 3200 个绝对傅立叶系数。
现在我想做一个 PCA 和 SVD。由于我的数据已经标准化并且所有值都具有相同的单位,我认为我可以使用“原始数据”进行计算。但是,PCA 的特征值和 SVD 的奇异值是不同的。(显示图片/链接)
我究竟做错了什么?PCA 和 SVD 应该如何获取数据?标准化,标准化,原始?
请帮我!谢谢
我的代码:
pca - 如何将 PCA 与具有相同单位的值的数据一起使用
我的数据由 400000 个样本组成,具有 3200 个相同单位的值(400000x3200)。我知道,当数据具有不同大小的值时,首先您必须对数据进行标准化或规范化,因此每个值的比例是相同的。
但是如何计算具有相同单位值的数据的 PCA?之前需要对数据进行规范化、标准化、居中吗?具有相同单位的值的 cov 矩阵呢?
我希望有人能帮忙。谢谢
python - 如何标准化具有一定均值和标准差值的数据
如何标准化具有特定均值和标准差值的数据集?
我知道存在类似的包,sklearn.preprocessing.StandardScaler
但这个包只允许我们使用数据集自己的平均值和标准差值来标准化数据集。如果我想使用自己指定的均值和标准差值对数据集进行标准化怎么办?
我可以使用 Python 中的包吗?否则,我能想到的一种方法是为每个特征手动执行此操作(即(X-mean)/(stddev)
,对于数据集中的每个特征,其中mean
=我自己指定的平均值,stddev
=我自己指定的标准偏差值)。
提前致谢。