我面临的当前问题来自以下情况。我有一个脚本,它运行命令行程序来查找特定文件夹中具有特定扩展名的所有文件,让我们将这些文件称为文件 A。脚本的另一部分通过每个文件运行 grep 命令以获取文件 A 中的文件名。什么会是存储文件 A 中的文件名且仅存储文件 A 的最佳方法,我该如何实现?谢谢
user428370
问问题
339 次
1 回答
2
编辑:我看到你是问上一个问题的人!为什么要开一个新的?
最近有一个关于这个确切问题的问题 - 您正在建模的结构是有向图。请参阅我对这个问题的回答,使用 Python 的networkx
包。如果您要对数据进行一些后处理,使用这个包是一个好主意。但是,对于简单的情况,您可以制作自己的数据结构。这是一个使用图的邻接表表示的示例;改用邻接矩阵并不难。
from collections import defaultdict
adj_list = defaultdict( set )
for filename in os.listdir( <dir> ):
with open( filename ) as theFile:
for line in theFile:
# parse line into filename, say 'target'
adj_list[ filename ].add( target )
这将为您提供文件名字典 -> 由该文件链接的文件。
于 2010-08-25T12:25:00.853 回答