0

在我所在领域的许多文章中,重复了这句话:“已将 2 个矩阵归一化为具有相同的平均平方和(在所有主题和每种模态的所有体素上计算)”。假设我们有两个矩阵,行定义不同的主题,列是特征(体素)。在这些文章中,没有太多关于归一化方法的解释。有谁知道我应该如何规范化数据以具有“相同的平均平方和”?我完全不明白。谢谢

4

1 回答 1

0

首先,在这种情况下,标准化也称为特征缩放,这几乎可以概括。你扩展你的特征,你的数据以摆脱最终会干扰你的算法和结果的方差和值范围。

https://en.wikipedia.org/wiki/Feature_scaling

在数据处理中,标准化非常有用(取决于应用程序)。例如,在基于距离的机器学习算法中,您应该对特征进行归一化,以便对算法的结果做出成比例的贡献,而与特征所包含的值范围无关。

为此,您可以使用不同的统计度量,例如平方和:

SUM_i(Xi-Xbar)²

除此之外,您可以使用数据的方差或标准差。

https://www.westgard.com/lesson35.htm#4

然后可以使用这些统计术语来规范化您的数据,以提高算法的聚类质量等。使用哪个术语和使用哪种方法在很大程度上取决于您使用的算法和数据以及您的目标。这是一篇论文,它比较了您可以选择的一些聚类方法:

http://maxwellsci.com/print/rjaset/v6-3299-3303.pdf

我希望这可以帮助你一点。

于 2017-02-28T10:26:41.643 回答