4

给定一个按普遍使用顺序排序的常用词列表,是否有可能按照“最常用”序列的顺序形成任意长度(任何所需数量的词)的词组合。例如,如果最常见的词是“a, b, c”,那么对于长度为 2 的组合,将生成以下内容:

aa
ab
ba
bb
ac
bc
ca
cb
cc

这是长度 3 的正确列表:

aaa
aab
aba
abb
baa
bab
bba
bbb
aac
abc
bac
bbc
aca
acb
bca
bcb
acc
bcc
caa
cab
cba
cbb
cac
cbc
cca
ccb
ccc

对于任意数量的元素的 2 或 3 个单词(设置长度)的组合,这很容易实现,但是可以对任意长度执行此操作吗?我想在 PHP 中实现它,但非常感谢伪代码甚至算法摘要!

4

4 回答 4

1

这是一个可能是您需要的递归函数。这个想法是,当给定一个长度和一个字母时,首先生成所有短一个字母但不包括该字母的序列。将新字母添加到末尾,您就有了涉及该字母的序列的第一部分。然后将新字母向左移动。循环浏览每个字母序列,包括右边的新字母。

所以如果你有 gen(5, d) 它会从

(aaaa)d
(aaab)d
...
(cccc)d

然后当它完成交流组合时,它会做

(aaa)d(a)
...
(aaa)d(d)
(aab)d(d)
... 
(ccc)d(d)

然后当它完成 d 作为第 4 个字母时,它会将其移动到第 3 个

(aa)d(aa)

等等等等

<?php 
/** 
 * Word Combinations (version c) 6/22/2009 1:20:14 PM 
 * 
 * Based on pseudocode in answer provided by Erika: 
 *   http://stackoverflow.com/questions/1024471/generating-ordered-weighted-combinations-of-arbitrary-length-in-php/1028356#1028356 
 *   (direct link to Erika's answer) 
 * 
 * To see the results of this script, run it: 
 *   http://stage.dustinfineout.com/stackoverflow/20090622/word_combinations_c.php 
**/ 

init_generator(); 

function init_generator() { 
    global $words; 
    $words = array('a','b','c'); 
    generate_all(5);


} 

function generate_all($len){
    global $words;
    for($i = 0; $i < count($words); $i++){
        $res = generate($len, $i); 

        echo join("<br />", $res);  
        echo("<br/>");
    }   
}

function generate($len, $max_index = -1){ 
    global $words; 

    // WHEN max_index IS NEGATIVE, STARTING POSITION 
    if ($max_index < 0) { 
        $max_index = count($words) - 1; 
    } 

    $list = array(); 


    if ($len <= 0) { 
        $list[] = "";
        return $list; 
    } 

    if ($len == 1) { 

        if ($max_index >= 1) { 
            $add = generate(1, ($max_index - 1));
            foreach ($add as $addit) { 
                $list[] = $addit; 
            } 


        } 
        $list[] = $words[$max_index]; 
        return $list; 
    } 

    if($max_index == 0) { 
        $list[] = str_repeat($words[$max_index], $len); 
        return $list; 
    } 

    for ($i = 1; $i <= $len; $i++){ 
        $prefixes = generate(($len - $i), ($max_index - 1)); 
        $postfixes = generate(($i - 1), $max_index); 
        foreach ($prefixes as $pre){ 
            //print "prefix = $pre<br/>";
            foreach ($postfixes as $post){ 
                //print "postfix = $post<br/>";
                $list[] = ($pre . $words[$max_index] . $post); 
            } 
        } 
    } 
    return $list; 
} 

?>
于 2009-06-22T17:05:49.040 回答
0

我搜索了 php 排列并得到:http ://www.php.happycodings.com/Algorithms/code21.html

我还没有研究过代码是否好。但它似乎做你想做的事。

于 2009-06-21T18:42:18.133 回答
0

我不知道您要计算的内容是什么术语,但它不是组合甚至排列,而是某种重复排列的排列。

下面我附上了一些稍微修改过的代码,这些代码来自我身边最近的东西,它做这样的事情,LPC 中的字符串置换生成器。对于 a, b, c 它生成

abc
bac
bca
acb
cab
cba

可能可以对其进行调整以启用您想要的重复行为。

varargs mixed array permutations(mixed array list, int num) {
    mixed array out = ({});
    foreach(mixed item : permutations(list[1..], num - 1))
        for(int i = 0, int j = sizeof(item); i <= j; i++)
            out += ({ implode(item[0 .. i - 1] + ({ list[0] }) + item[i..], "") });
    if(num < sizeof(list))
        out += permutations(list[1..], num);
    return out;
}

FWIW,说明您的问题的另一种方式是,对于 N 个元素的输入,您希望在一个以输入元素作为节点的全连接、自连接图中的长度为 N 的所有路径的集合。

于 2009-06-21T18:48:00.700 回答
0

我假设当说固定长度很容易时,您使用的是m嵌套循环,其中m是序列的长度(在您的示例中为 2 和 3)。

您可以像这样使用递归:

您的单词编号为 0、1、.. n,您需要生成所有长度为m的序列:

generate all sequences of length m:
{
    start with 0, and generate all sequences of length m-1
    start with 1, and generate all sequences of length m-1
    ...
    start with n, and generate all sequences of length m-1 
}

generate all sequences of length 0
{
    // nothing to do
}

如何实施?好吧,在每次调用中,您可以再将一个元素推到数组的末尾,当您到达递归的末尾时,打印出数组的内容:

// m is remaining length of sequence, elements is array with numbers so far
generate(m, elements)
{
    if (m == 0)
    {
        for j = 0 to elements.length print(words[j]);
    }
    else
    {
        for i = 0 to n - 1
        {
            generate(m-1, elements.push(i));
        }   
    }
}

最后,这样称呼它: generate(6, array())

于 2009-06-21T19:14:45.537 回答