21

如何轻松处理Pandas(Python 数据分析库)中 Series 或 DataFrame 的不确定性?我最近发现了 Python不确定性包,但我想知道是否有任何更简单的方法可以直接在 Pandas 中管理不确定性。我在文档中没有找到任何关于此的内容。

更准确地说,我不想将不确定性作为新列存储在我的 DataFrame 中,因为我认为它们是数据系列的一部分,不应该在逻辑上与之分开。例如,删除 DataFrame 中的列没有任何意义,但删除它的不确定性没有任何意义,所以我必须手动处理这种情况。

我正在寻找data_frame.uncertainties可以像data_frame.values属性一样工作的东西。A data_frame.units(用于数据单元)也会很棒,但我认为 Pandas 中不存在这些东西(还没有?)......

4

1 回答 1

1

如果你真的希望它是一个内置函数,你可以创建一个类来放入你的数据框。然后你可以定义你想要的任何值或函数。下面我写了一个快速示例,但您可以轻松添加单位定义或更复杂的不确定性公式

import pandas as pd

data={'target_column':[100,105,110]}

class data_analysis():
    def __init__(self, data, percentage_uncertainty):
    self.df = pd.DataFrame(data)
    self.uncertainty = percentage_uncertainty*self.df['target_column'].values

当我跑

example=data_analysis(data,.01)
example.uncertainty

我得到了 array([1. , 1.05, 1.1 ])

希望这可以帮助

于 2019-05-02T08:51:37.147 回答