3

我在 Python 中有一个包含字符串的列表:

["foo/bar","foo/bar/baz","foo/bar/qux"]

我试图分离出该列表中不包含在任何其他较长元素中的最小元素。在这种情况下,我想返回一个列表["foo/bar/baz","foo/bar/qux"],因为它们不再包含在任何元素中。我不想要"foo/bar",因为它包含在"foo/bar/baz"and中"foo/bar/qux"。我一直在尝试嵌套 for 和 if 语句,但我似乎无法做到正确。谁能指出我正确的方向?

4

5 回答 5

2

我会先对列表进行排序(在这种情况下,它已经排序),然后将每个字符串与下一个字符串进行比较:

使用列表理解:

l = ["foo/bar/baz/abc", "fo/bar","foo/bar/baz","foo/bar/qux", "foo/bar/qux/abc"]
l.sort()

length = len(l)

new_list = [v for (i, v) in enumerate(l) if (index < length - 1) and (l[i] not in l[i + 1])]

new_list.append(l[-1])  // Append last element (as it will always be there).

print new_list

输出

['fo/bar', 'foo/bar/baz/abc', 'foo/bar/qux/abc']
于 2013-07-01T22:36:15.280 回答
2

假设您真的在寻找叶目录(即,“包含在”实际上意味着“前缀为”并且斜杠特殊的),这里有一个简单的算法:

def leaf_dirs(dirlist):
    """Given a list of directories, find leaf directories"""
    parents = {}
    for path in dirlist:
        parts = path.split('/')
        if parts[0] == '':
            raise ValueError("can't handle rooted directory %s" % path)
        parent = '/'.join(parts[:-1])
        parents[parent] = True
    return [path for path in dirlist if path not in parents]

基本上,所有“父目录”名称都放入字典中,然后我们过滤掉这些名称。在“foo/bar/baz”和“foo/bar/quux”的情况下,父路径(foo/bar)被输入了两次,但我们并不关心。

编辑:解决 Omri Barel 指出的问题,而不仅仅是使用parts[:-1]

        while parts:
            parts.pop() # strip last path component
            parent = '/'.join(parts)
            parents[parent] = True

这将剥离最后一个组件并进入父组件。(我这里特意输入了空字符串,这样简单一点。)

于 2013-07-01T22:57:44.997 回答
1
new_list = []

for i in old_list:
    found = False
    for j in old_list:
       if i in j and i != j:
            found = True
            break
    if not found:
        new_list.append(i)
于 2013-07-01T22:43:17.370 回答
1
l = ["foo/bar","foo/bar/baz","foo/bar/qux", "foo/bar/qax/dda"]
sorted_l = sorted(l, key=len)
length, found = -1, False
for i,v in enumerate(sorted_l):
    if found and not length == len(v): break
    for vv in sorted_l[i+1:]:
        if v in vv: break
    else: 
        print v
        length = len(v)
        found = True
于 2013-07-01T22:46:34.933 回答
1

这似乎您应该实际构建一个树模型,然后采用从叶子到根的路径。

这是一个可能有用的 python 树库:https ://github.com/caesar0301/pyTree

于 2013-07-01T22:47:39.203 回答