假设您真的在寻找叶目录(即,“包含在”实际上意味着“前缀为”并且斜杠是特殊的),这里有一个简单的算法:
def leaf_dirs(dirlist):
"""Given a list of directories, find leaf directories"""
parents = {}
for path in dirlist:
parts = path.split('/')
if parts[0] == '':
raise ValueError("can't handle rooted directory %s" % path)
parent = '/'.join(parts[:-1])
parents[parent] = True
return [path for path in dirlist if path not in parents]
基本上,所有“父目录”名称都放入字典中,然后我们过滤掉这些名称。在“foo/bar/baz”和“foo/bar/quux”的情况下,父路径(foo/bar)被输入了两次,但我们并不关心。
编辑:解决 Omri Barel 指出的问题,而不仅仅是使用parts[:-1]
:
while parts:
parts.pop() # strip last path component
parent = '/'.join(parts)
parents[parent] = True
这将剥离最后一个组件并进入父组件。(我这里特意输入了空字符串,这样简单一点。)