1

我面临的当前问题来自以下情况。我有一个脚本,它运行命令行程序来查找特定文件夹中具有特定扩展名的所有文件,让我们将这些文件称为文件 A。脚本的另一部分通过每个文件运行 grep 命令以获取文件 A 中的文件名。什么会是存储文件 A 中的文件名且仅存储文件 A 的最佳方法,我该如何实现?谢谢

4

1 回答 1

2

编辑:我看到你是问上一个问题的人!为什么要开一个新的?


最近有一个关于这个确切问题的问题 - 您正在建模的结构是有向图。请参阅对这个问题的回答,使用 Python 的networkx包。如果您要对数据进行一些后处理,使用这个包是一个好主意。但是,对于简单的情况,您可以制作自己的数据结构。这是一个使用图的邻接表表示的示例;改用邻接矩阵并不难。

from collections import defaultdict
adj_list = defaultdict( set )

for filename in os.listdir( <dir> ):
    with open( filename ) as theFile:
        for line in theFile:
            # parse line into filename, say 'target'
            adj_list[ filename ].add( target )

这将为您提供文件名字典 -> 由该文件链接的文件。

于 2010-08-25T12:25:00.853 回答