7

给定k第一个n自然数的组合,出于某种原因,我需要在返回的那些组合中找到这种组合的位置itertools.combination(range(1,n),k)(原因是这样我可以使用 alist而不是 adict来访问与每个组合关联的值,知道组合)。

由于itertools以常规模式产生它的组合,因此可以做到这一点(而且我还找到了一个简洁的算法),但我正在寻找一种更快/更自然的方式,我可能会忽略它。

顺便说一下,这是我的解决方案:

def find_idx(comb,n):
    k=len(comb)
    idx=0
    last_c=0
    for c in comb:
        #idx+=sum(nck(n-2-x,k-1) for x in range(c-last_c-1)) # a little faster without nck caching
        idx+=nck(n-1,k)-nck(n-c+last_c,k) # more elegant (thanks to Ray), faster with nck caching
        n-=c-last_c
        k-=1
        last_c=c
    return idx

其中nck返回n,k 的二项式系数

例如:

comb=list(itertools.combinations(range(1,14),6))[654] #pick the 654th combination
find_idx(comb,14) # -> 654

这是一个等效但可能涉及较少的版本(实际上我从下一个派生了前一个)。我将组合的整数c视为二进制数字中 1 的位置,我在解析 0/1 时构建了一个二叉树,并且在解析过程中发现了索引递增的规则模式:

def find_idx(comb,n):
    k=len(comb)
    b=bin(sum(1<<(x-1) for x in comb))[2:]
    idx=0
    for s in b[::-1]:
        if s=='0':
            idx+=nck(n-2,k-1)
        else:
            k-=1
        n-=1
    return idx
4

3 回答 3

1

您的解决方案似乎很快。在find_idx中,您有两个 for 循环,可以使用公式优化内部循环:

C(n, k) + C(n-1, k) + ... + C(n-r, k) = C(n+1, k+1) - C(n-r, k+1)

所以,你可以sum(nck(n-2-x,k-1) for x in range(c-last_c-1))nck(n-1, k) - nck(n-c+last_c, k).

我不知道你是如何实现你的nck(n, k)函数的,但它应该是 O(k) 以时间复杂度衡量的。在这里我提供我的实现:

from operator import mul
from functools import reduce # In python 3
def nck_safe(n, k):
    if k < 0 or n < k: return 0
    return reduce(mul, range(n, n-k, -1), 1) // reduce(mul, range(1, k+1), 1)

最后,您的解决方案无需递归即可变为 O(k^2)。它很快,因为k不会太大。

更新

我注意到它nck的参数是(n, k). n 和 k 都不会太大。我们可以通过缓存来加速程序。

def nck(n, k, _cache={}):
    if (n, k) in _cache: return _cache[n, k]
    ....
    # before returning the result
    _cache[n, k] = result
    return result

在 python3 中,这可以通过使用functools.lru_cache装饰器来完成:

@functools.lru_cache(maxsize=500)
def nck(n, k):
    ...
于 2013-01-30T15:21:56.780 回答
0

看起来您需要更好地指定您的任务,否则我只是弄错了。对我来说,似乎当您迭代时,itertools.combination您可以将需要的索引保存到适当的数据结构中。如果您需要所有这些,那么我会选择dictdict满足您的所有需求):

combinationToIdx = {}
for (idx, comb) in enumerate(itertools.combinations(range(1,14),6)):
    combinationToIdx[comb] = idx

def findIdx(comb):
    return combinationToIdx[comb]
于 2013-01-22T21:21:00.267 回答
0

我挖出了一些旧的(尽管它已被转换为 Python 3 语法)代码,其中包括combination_index执行您请求的函数:

def fact(n, _f=[1, 1, 2, 6, 24, 120, 720]):
    """Return n!
    The “hidden” list _f acts as a cache"""
    try:
        return _f[n]
    except IndexError:
        while len(_f) <= n:
            _f.append(_f[-1] * len(_f))
        return _f[n]

def indexed_combination(n: int, k: int, index: int) -> tuple:
    """Select the 'index'th combination of k over n
    Result is a tuple (i | i∈{0…n-1}) of length k

    Note that if index ≥ binomial_coefficient(n,k)
    then the result is almost always invalid"""

    result= []
    for item, n in enumerate(range(n, -1, -1)):
        pivot= fact(n-1)//fact(k-1)//fact(n-k)
        if index < pivot:
            result.append(item)
            k-= 1
            if k <= 0: break
        else:
            index-= pivot
    return tuple(result)

def combination_index(combination: tuple, n: int) -> int:
    """Return the index of combination (length == k)

    The combination argument should be a sorted sequence (i | i∈{0…n-1})"""

    k= len(combination)
    index= 0
    item_in_check= 0
    n-= 1 # to simplify subsequent calculations
    for offset, item in enumerate(combination, 1):
        while item_in_check < item:
            index+= fact(n-item_in_check)//fact(k-offset)//fact(n+offset-item_in_check-k)
            item_in_check+= 1
        item_in_check+= 1
    return index

def test():
    for n in range(1, 11):
        for k in range(1, n+1):
            max_index= fact(n)//fact(k)//fact(n-k)
            for i in range(max_index):
                comb= indexed_combination(n, k, i)
                i2= combination_index(comb, n)
                if i2 != i:
                    raise RuntimeError("mismatching n:%d k:%d i:%d≠%d" % (n, k, i, i2))

indexed_combination进行逆运算。

PS 我记得我有时尝试删除所有这些fact调用(通过替换适当的增量乘法和除法),但代码变得更加复杂,实际上并没有更快。如果我用预先计算的阶乘列表代替fact函数,可以实现加速,但是对于我的用例来说,速度差异可以忽略不计,所以我保留了这个版本。

于 2016-09-17T20:37:29.010 回答