4

在我的项目中,我构建了一个以 pandas DataFrame 为核心的类。数据框中的值取决于一些规范,我用一些代表我想要使用的数据的字母对其进行初始化。我把我所有的函数都放在一个里面创建数据框,__init__因为我知道这个函数是一次性的,初始化后不需要它们。此外,在我的课程在以后的代码中使用后,我也不想访问这些函数。(我不确定这是否是“pythonic”方式)。

在使用和 plotData() 方法构建基本类之后,__str__我想应用一些过滤器并构建一个新类,其中附加列是过滤器。我想这样做,__init__但保留已经完成的一切。换句话说,我不想重写整个__init__只想将新列添加到基本数据框。

以类似的方式,我想在 plotData() 函数中添加一个额外的图

我的原始代码已经有好几行了,但原理与下面列出的代码非常相似。

import pandas as pd
import pylab as pl
class myClass(object):
    def __init__(self, frameType = 'All'):
        def method1():
            myFrame = pd.DataFrame({'c1':[1,2,3],'c2':[4,5,6],'c3':[7,8,9]})
            return myFrame
        def method2():
            myFrame = pd.DataFrame({'c1':[.1,.2,.3],'c2':[.4,.5,.6],'c3':[.7,.8,.9]})
            return myFrame
        def makingChiose(self):
            if self.frameType == 'All':
                variable = method1() + method2() 
            elif self.frameType == 'a':
                variable = method1()
            elif self.frameType == 'b':
                variable = method2()
            else:
                variable =  pd.DataFrame({'c1':[0,0,0],'c2':[0,0,0],'c3':[0,0,0]})
            #print 'FROM __init__ : %s' % variable
            return variable           
        self.frameType = frameType      
        self.cObject = makingChiose(self) # object created by the class
    def __str__(self):
        return str(self.cObject)
    def plotData(self):
        self.fig1 = pl.plot(self.cObject['c1'],self.cObject['c2'])
        self.fig2 = pl.plot(self.cObject['c1'],self.cObject['c3'])
        pl.show()

class myClassAv(myClass):
    def addingCol(self):
        print 'CURRENT cObject \n%s' % self.cObject # the object is visible 
        self.cObject['avarage'] = (self.cObject['c1']+self.cObject['c2']+self.cObject['c3'])/3
        print 'THIS WORKS IN GENERAL\n%s' % str((self.cObject['c1']+self.cObject['c2']+self.cObject['c3'])/3) # creating new column works
    def plotData(self):
        # Function to add new plot to already existing plots
        self.fig3 = pl.plot(self.cObject['c1'],self.cObject['avarage'])
if __name__ == '__main__':
    myObject1 = myClass()
    print 'myObject1 =\n%s' % myObject1
    myObject1.plotData()
    myObject2 = myClass('a')
    print 'myObject2 =\n%s' % myObject2
    myObject3 = myClass('b')
    print 'myObject3 =\n%s' % myObject3
    myObject4 = myClass('c')
    print 'myObject4 =\n%s' % myObject4

    myObject5 = myClassAv('a').addingCol()
    print 'myObject5 =\n%s' % myObject5
    myObject5.plotData()

大多数代码都可以工作,至少在初始化时是这样,但是当我尝试使用附加列创建新数据框时出现错误。当我把它作为新的时,__init__我创建了一个全新的初始化并且我失去了所有已经完成的事情。我创建了一个新函数,但在调用新类而不是新类中的函数后,我希望有附加列 代码的输出如下所示:

myObject1 =
    c1   c2   c3
0  1.1  4.4  7.7
1  2.2  5.5  8.8
2  3.3  6.6  9.9
myObject2 =
   c1  c2  c3
0   1   4   7
1   2   5   8
2   3   6   9
myObject3 =
    c1   c2   c3
0  0.1  0.4  0.7
1  0.2  0.5  0.8
2  0.3  0.6  0.9
myObject4 =
   c1  c2  c3
0   0   0   0
1   0   0   0
2   0   0   0
CURRENT cObject 
   c1  c2  c3
0   1   4   7
1   2   5   8
2   3   6   9
THIS WORKS IN GENERAL
0    4
1    5
2    6
myObject5 =
None
Traceback (most recent call last):
  File "C:\Users\src\trys.py", line 57, in <module>
    myObject5.plotData()
AttributeError: 'NoneType' object has no attribute 'plotData'

问题是:我可以“部分”覆盖超类的方法,以使该方法中以前包含的内容具有一些新功能吗?我想将 myClassAv() 初始化为具有四列而不是像 myClass() 那样的三列的数据框,并且我想让 myClassAv().plotData() 绘制第三行,但保留两列来自基类。

我不知道如何解释错误以及为什么 myObject5 为 None,但我怀疑它与继承有关。

此外,如果您建议我应该以不同的方式完成我的所有想法,我将不胜感激。

4

1 回答 1

6

myClass.__init__在里面打电话怎么样myClassAv.__init__

def __init__(self, frameType='All'):
    myClass.__init__(self, frameType)
    def addingCol(cObject): 
        ...
    addingCol(self.cObject)

为了具体,

import pandas as pd
import pylab as pl
import numpy as np


class myClass(object):
    def __init__(self, frameType='All'):
        def method1():
            myFrame = pd.DataFrame(
                {'c1': [1, 2, 3], 'c2': [4, 5, 6], 'c3': [7, 8, 9]})
            return myFrame

        def method2():
            myFrame = pd.DataFrame(
                {'c1': [.1, .2, .3], 'c2': [.4, .5, .6], 'c3': [.7, .8, .9]})
            return myFrame

        def makingChoice(self):
            if self.frameType == 'All':
                variable = method1() + method2()
            elif self.frameType == 'a':
                variable = method1()
            elif self.frameType == 'b':
                variable = method2()
            else:
                variable = pd.DataFrame(
                    {'c1': [0, 0, 0], 'c2': [0, 0, 0], 'c3': [0, 0, 0]})
            # print 'FROM __init__ : %s' % variable
            return variable
        self.frameType = frameType
        self.cObject = makingChoice(self)  # object created by the class

    def __str__(self):
        return str(self.cObject)

    def plotData(self):
        self.fig1 = pl.plot(self.cObject['c1'], self.cObject['c2'])
        self.fig2 = pl.plot(self.cObject['c1'], self.cObject['c3'])
        pl.show()


class myClassAv(myClass):
    def __init__(self, frameType='All'):
        myClass.__init__(self, frameType)

        def addingCol(cObject):
            print 'CURRENT cObject \n%s' % cObject  # the object is visible
            cObject['average'] = cObject.mean(axis=1)
            # creating new column works
            print 'THIS WORKS IN GENERAL\n%s' % str(cObject['average'])
            return cObject

        addingCol(self.cObject)

    def plotData(self):
        # Function to add new plot to already existing plots
        self.fig3 = pl.plot(self.cObject['c1'], self.cObject['average'])

if __name__ == '__main__':
    myObject1 = myClass()
    print 'myObject1 =\n%s' % myObject1
    myObject1.plotData()
    myObject2 = myClass('a')
    print 'myObject2 =\n%s' % myObject2
    myObject3 = myClass('b')
    print 'myObject3 =\n%s' % myObject3
    myObject4 = myClass('c')
    print 'myObject4 =\n%s' % myObject4

    myObject5 = myClassAv('a')
    print 'myObject5 =\n%s' % myObject5
    myObject5.plotData()

顺便说一句,而不是

self.cObject['avarage'] = (self.cObject['c1']+self.cObject['c2']+self.cObject['c3'])/3

你可以使用mean(axis = 1)

self.cObject['average'] = self.cObject.mean(axis=1)
于 2013-01-20T23:10:13.143 回答