8

我正在寻找将给定集合划分为不相交子集的代码。例如,一组足球运动员,我们根据他们所属的球队对他们进行划分。最后我想要一份代表名单,即每支球队的一名球员。

所有足球运动员都认识他们球队中的所有其他球员——这与复杂性非常相关。所以,我目前关于如何做到这一点的想法如下(set目前在哪里 a LinkedHashSet<T>):

while (!set.isEmpty()) {
    E e = set.iterator().next();
    makeRepresentative(e);
    set.remove(AllPlayersOnSameTeamAs(e));
}

然而,在 while 循环的每一步都构建一个新的迭代器感觉很奇怪。LinkedHashSet 应该在内部具有某种firstElement()功能(对于它的 LinkedList 行为),但由于某种原因,我找不到如何做到这一点。我也尝试了一个 foreach 循环,但这导致了java.util.ConcurrentModificationException.

我应该如何正确地做到这一点?

4

2 回答 2

1
while (!set.isEmpty()) {    
    Collection<E> toBeRemoved = new ArrayList<E>();
    E first = set.iterator().next();
    doSomethingWith(e);
    for (E e : set) {
        if (similar(first, e)) toBeRemoved.add(e);
    }
    set.removeAll(toBeRemoved);
}

在阅读您的编辑并更好地理解之后,您可能会喜欢以下解决方案:

Collection<E> processed = new ArrayList<E>();
for (E e1 : set) {
    boolean similar = false;
    for (E e2 : processed) {
        if (similar(e1, e2)) similar = true;
    }
    if (!similar) {
        doSomethingWith(e1);
        processed.add(e1);
    }
}
set.clear();

请注意,在不了解“相似”定义的情况下,这个问题本质上是二次问题。可以使它成为线性或次二次的唯一方法是,是否有一种方法可以将相似元素散列到相同的键。在这种情况下,您可以使用上面的第二种策略,但修改processed结构和检查先前相似元素的部分以提高效率(目前该步骤与相似组的数量呈线性关系,而在总元素中可能是线性的) .

此外,任何亚二次方肯定会使用比常量内存更多的东西。如果你想要恒定的记忆,这是你能做的最好的事情(这绝对是二次时间):

while (!set.isEmpty()) {
    Iterator<E> iter = set.iterator();
    E first = iter.next();
    doSomethingWith(first);
    while (iter.hasNext()) {
        if (similar(first, iter.next())) iter.remove();
    }
}

请注意,使用 iter.remove() 可以解决您之前遇到的并发修改问题。

于 2012-09-12T00:18:21.080 回答
0

我会一次性完成,跟踪我见过的团队。

Set<Team> processedTeams = new HashSet<>();
Set<Players> representatives = new HashSet<>();
for(e:players) {
  Team t = e.getTeam();
  if(processedTeams.contains(t))
    continue;
  processedTeams.add(t);
  representatives.add(e)
}
于 2015-03-12T04:07:26.037 回答