5

在 python 中,编写如下__init__定义是不是很糟糕:

class someFileType(object):
    def __init__(self, path):
        self.path = path
        self.filename = self.getFilename()
        self.client = self.getClient()
        self.date = self.getDate()
        self.title = self.getTitle()
        self.filetype = self.getFiletype()
    def getFilename(self):
        '''Returns entire file name without extension'''
        filename = os.path.basename(self.path)
        filename = os.path.splitext(filename)
        filename = filename[0]
        return filename
    def getClient(self):
        '''Returns client name associated with file'''
        client = self.filename.split()
        client = client[1] # Assuming filename is formatted "date client - docTitle"
        return client

初始化变量在哪里调用返回字符串的函数?或者它被认为是惰性编码?这主要是为了让我免于写作something.filetype,因为something.getFiletype()每当我想引用文件的某些方面时。

此代码是按客户端、然后按文档类型以及基于文件名中的数据的其他操作将文件分类到文件夹中。

4

2 回答 2

12

不,我不明白为什么那会是不好的形式。事实上,在创建实例时只计算一次这些值可能是一个好主意。

property您还可以使用缓存s将计算推迟到需要时:

class SomeFileType(object):
    _filename = None
    _client = None

    def __init__(self, path):
        self.path = path

    @property
    def filename(self):
        if self._filename is None: 
            filename = os.path.basename(self.path)
            self._filename = os.path.splitext(filename)[0]
        return self._filename

    @property
    def client(self):
        '''Returns client name associated with file'''
        if self._client is None:
            client = self.filename.split()
            self._client = client[1] # Assuming filename is formatted "date client - docTitle"
        return self._client

现在,访问somefiletypeinstance.client将根据self.filename需要触发计算,并缓存它自己的计算结果。

在这种特定情况下,您可能还想创建.path一个属性;一个带有清除缓存值的设置器:

class SomeFileType(object):
    _filename = None
    _client = None

    def __init__(self, path):
        self._path = path

    @property
    def path(self):
        return self._path

    @path.setter
    def path(self, value):
        # clear all private instance attributes
        for key in [k for k in vars(self) if k[0] == '_']:
            delattr(self, key)
        self._path = value

    @property
    def filename(self):
        if self._filename is None: 
            filename = os.path.basename(self.path)
            self._filename = os.path.splitext(filename)[0]
        return self._filename

    @property
    def client(self):
        '''Returns client name associated with file'''
        if self._client is None:
            client = self.filename.split()
            self._client = client[1] # Assuming filename is formatted "date client - docTitle"
        return self._client

因为property基于 - 的缓存确实增加了一些复杂性开销,所以您需要考虑是否真的值得花时间;对于您的具体简单示例,可能不是。属性的计算成本确实非常低,除非您计划创建大量这些类,否则与必须维护按需缓存属性的心理成本相比,提前计算属性的开销可以忽略不计。

于 2013-04-16T15:25:34.953 回答
5

您的代码正在做两件不同的事情:

a) 通过将某些计算属性公开为变量而不是函数来简化类 API。

b) 预先计算它们的值。

第一个任务是属性的用途;一个直接的使用将使您的代码更简单,而不是更复杂,并且(同样重要)将使意图更清晰:

class someFileType(object):
    @property
    def filename(self):
        return os.path.basename(self.path)

然后您可以编写var.filename,您将根据路径动态计算文件名。

@Martijn 的解决方案添加了缓存,它还负责 b 部分(预计算)。至少在您的示例中,计算很便宜,所以我认为这样做没有任何好处。

相反,缓存或预计算会引发一致性问题。考虑以下代码段:

something = someFileType("/home/me/document.txt")
print something.filename    # prints `document`
...
something.path = "/home/me/document-v2.txt"
print something.filename   # STILL prints `document` if you cache values

最后一条语句应该打印什么?如果你缓存你的计算,你仍然会得到document而不是document-v2除非您确定没有人会尝试更改基本变量的值,否则您需要避免缓存,或者采取措施确保一致性。最简单的方法是禁止对path属性的设计目的之一进行修改。

结论:使用属性来简化你的界面。不要缓存计算,除非出于性能原因需要。如果您缓存,请采取措施确保一致性,例如通过将基础值设为只读。

PS。这些问题类似于数据库规范化(非规范化设计会引发一致性问题),但在 python 中,您有更多资源来保持同步。

于 2013-04-16T16:07:24.303 回答