2

我:我正在运行 Python 2.3.3,无法升级,而且我对 Python 没有太多经验。我的学习方法是谷歌搜索和阅读大量的 stackoverflow。

背景:我正在创建一个 python 脚本,其目的是将两个目录作为参数,然后对在这两个目录中找到的所有文件进行比较/差异。目录有子目录,也必须包含在 diff 中。每个目录都是一个列表,子目录是嵌套列表等等......

the two directories:
oldfiles/
    a_tar_ball.tar
    a_text_file.txt
    nest1/
        file_in_nest
        nest1a/
            file_in_nest

newfiles/
    a_tar_ball.tar
    a_text_file.txt
    nest1/
        file_in_nest
        nest1a/

问题:通常一切都应该正常,因为旧文件中的所有文件都应该存在于新文件中,但在上面的示例中,“新文件/”中缺少“file_in_nest”之一。我希望打印一条错误消息,告诉我缺少哪个文件,但是当我使用“比较”函数的当前实例下方的代码结构时,除了最接近的目录之外,不知道任何其他目录。我想知道是否有内置的错误处理可以在递归阶梯中发送有关文件和目录的信息,并在我们进行时向其中添加信息。如果我只是打印丢失文件的文件名,我将不知道其中的哪一个,因为“oldfiles”中有两个“file_in_nest”

def compare(file_tree)
    for counter, entry in enumerate(file_tree[0][1:]):
        if not entry in file_tree[1]
            # raise "some" error and send information about file back to the 
            # function calling this compare, might be another compare.
        elif not isinstance(entry, basestring):
            os.chdir(entry[0])
            compare(entry)
            os.chdir('..')
        else:
            # perform comparison (not relevant to the problem)

        # detect if "some" error has been raised
            # prepend current directory found in entry[0] to file information
            break

def main()
    file_tree = [['/oldfiles', 'a_tar_ball.tar', 'a_text_file.txt', \
                [/nest1', 'file_in_nest', [/nest1a', 'file_in_nest']], \
                'yet_another_file'], \
                ['/newfiles', 'a_tar_ball.tar', 'a_text_file.txt', \
                [/nest1', 'file_in_nest', [/nest1a']], \
                'yet_another_file']]

    compare(file_tree)

    # detect if "some" error has been raised and print error message

这是我在 stackoverflow 上的第一个活动,除了阅读 som 请告诉我是否应该改进这个问题!

//斯特凡

4

1 回答 1

1

好吧,这取决于您是将错误报告为异常还是某种形式的状态。

假设您想采用“异常”方式并在缺少一个文件时让整个程序崩溃,您可以定义自己的异常,将状态从被调用者保存到调用者:

class PathException(Exception):
    def __init__(self, path):
        self.path = path
        Exception.__init__(self)

def compare(filetree):
    old, new = filetree
    for counter, entry in enumerate(old[1:]):
        if entry not in new:
            raise PathException(entry)
        elif not isinstance(entry, basestring):
            os.chdir(entry[0])
            try:
                compare(entry)
                os.chdir("..")
            except PathException as e:
                os.chdir("..")
                raise PathException(os.path.join(entry, e.path))
        else:
            ...

您在哪里try进行递归调用,并使用调用者的信息更新任何传入的异常。

要在一个较小的示例中查看它,让我们尝试深度比较两个列表,如果它们不相等则引发异常:

class MyException(Exception):
    def __init__(self, path):
        self.path = path
        Exception.__init__(self)

def assertEq(X, Y):
    if hasattr(X, '__iter__') and hasattr(Y, '__iter__'):
        for i, (x, y) in enumerate(zip(X, Y)):
            try:
                assertEq(x, y)
            except MyException as e:
                raise MyException([i] + e.path)
    elif X != Y:
        raise MyException([]) # Empty path -> Base case

这给了我们:

>>> L1 = [[[1,2,3],[4,5],[[6,7,8],[7,9]]],[3,5,[7,8]]]
>>> assertEq(L1, L1)

什么都没有发生(列表相似),并且:

>>> L1 = [[[1,2,3],[4,5],[[6,7,8],[7,9]]],[3,5,[7,8]]]
>>> L2 = [[[1,2,3],[4,5],[[6,7,8],[7,5]]],[3,5,[7,8]]] # Note the [7,9] -> [7,5]
>>> try:
...     assertEq(L1, L2)
... except MyException as e: 
...     print "Diff at",e.path
Diff at [0, 2, 1, 1]
>>> print L1[0][2][1][1], L2[0][2][1][1]
9 5

这给出了完整的路径。

由于递归列表或路径基本上是相同的东西,因此很容易适应您的用例。

解决此问题的另一种简单方法是将文件中的这种差异报告为简单的差异,类似于其他差异:您可以将其作为旧文件和(不存在的)新文件之间的差异返回,或者同时返回列表文件的差异和文件差异列表,在这种情况下,很容易递归地更新递归调用返回的值。

于 2013-11-12T17:39:55.833 回答