0

我在 pandas 中有一个数据框,其中包含我的实验数据。它看起来像这样:

KE  BE  EXP_DATA  COL_1  COL_2  COL_3 .....
10  1   5         1      2      3   
9   2   .         .      .      .
8   3   .         .
7   4
6   5
.
.   

未使用 KE 列。BE 是 x 轴的值,所有其他列都是 y 轴值。对于规范化,我使用了Michael Aquilina 的帖子中的Normalize也提出的想法。因此,我需要找到我的数据的最大值和最小值。我这样做

    minBE = self.data[EXP_DATA].min()
    maxBE = self.data[EXP_DATA].max()

现在我想找到该列的最大值和最小值,但只针对“列”EXP_DATA 中的范围,当“列”BE 在某个范围内时。所以本质上我只想在某个 X 范围内规范化数据。

解决方案

感谢 Milo 给我的解决方案,我现在使用这个功能:

def normalize(self, BE="Exp",NRANGE=False):
    """
    Normalize data by dividing all components by the max value of the data.

    """
    if BE not in self.data.columns:
        raise NameError("'{}' is not an existing column. ".format(BE) +
                        "Try list_columns()")
    if NRANGE and len(NRANGE)==2:
        upper_be = max(NRANGE)
        lower_be = min(NRANGE)
        minBE = self.data[BE][(self.data.index > lower_be) & (self.data.index < upper_be)].min()
        maxBE = self.data[BE][(self.data.index > lower_be) & (self.data.index < upper_be)].max()
        for col in self.data.columns:                                                           # this is done so the data in NRANGE is realy scalled between [0,1]
            msk = (self.data[col].index < max(NRANGE)) & (self.data[col].index > min(NRANGE))
            self.data[col]=self.data[col][msk]
    else:

        minBE = self.data[BE].min()
        maxBE = self.data[BE].max()

    for col in self.data.columns:
        self.data[col] = (self.data[col] - minBE) / (maxBE - minBE)

如果我使用参数 NRANGE=[a,b] 调用该函数,并且a 和 b 也是我绘图的 x 限制,它会自动在 0 和 1 之间缩放可见的 Y 值,因为其余数据被屏蔽。如果在没有 NRANGE 参数的情况下调用该函数,则传递给该函数的整个数据范围将从 0 到 1 缩放。

谢谢您的帮助!

4

1 回答 1

2

您可以使用布尔索引。例如,在大于 2 且小于 5的列EXP_DATA中选择最大值和最小值:BE

lower_be = 2
upper_be = 5

max_in_range = self.data['EXP_DATA'][(self.data['BE'] > lower_be) & (self.data['BE'] < upper_be)].max()
min_in_range = self.data['EXP_DATA'][(self.data['BE'] > lower_be) & (self.data['BE'] < upper_be)].min()
于 2017-07-14T09:59:26.303 回答