0

我正在尝试使用以下规则实现一个小游戏:给定一组随机字母(例如 10 个),我想找到可以从这些字母中形成的所有可能单词。我为此使用了标准字典。

字母可以多次使用,并不是所有的字母都必须使用,只要是4个字符以上的单词即可。我认为这类似于解决字谜,只是允许多次使用字母。

例如给定的字母:qrbdtes 可能的词:bedders、甜点等。

为了寻找支持 O(1) 的数据结构来检查一个提议的单词是否在字典中,我找到了这篇论文,随后还在这里找到了一个有效的 Java DAWG 实现。

这就是我卡住的地方: 当尝试生成可以从这些字母中创建的可能单词列表时,我想知道使用 DAWG 实现是否遗漏了一些东西。我在这里看到其他线程建议使用 Trie 并递归地遍历节点,但我希望我可以用 DAWG 做类似的事情。

我目前正在使用的实现是遍历字典中的所有单词,然后跳过任何包含不属于先前分配的字母的字母的单词。这可行,但速度很慢,遍历字典中的所有单词 * 最坏情况下约 20 个字母。

for(String word : dawg.getAllStrings()) {
     boolean blacklist = false;
     for(int i = 0; i<nonLetters.length(); i++) {
         if(word.indexOf(nonLetters.charAt(i)) >= 0) {
             blacklist = true;
             break;
         }
     }

     if(!blacklist)
         possibleWordList.add(word);
}

我尝试实现递归单词匹配,但由于实现不公开对其 Node 实现的访问权限,但我可以在本地更改它。

如果无法访问节点,我可以使用 dawg.contains(letter),但由于需要多次使用字母,我想知道这是否真的有帮助。例如,我会从'A' 开始,然后是'AA',...停止在例如20 A's。

使用 Trie 会更容易吗?找到匹配的单词仍然相当快,但更容易生成可能的单词列表?

是否有其他 DAWG 库公开节点遍历或具有 ref 实现来生成所有可能的单词?

感谢您的任何帮助或指点!

4

2 回答 2

1

我认为这是一个好方法。我向问题中引用的 DAWG 实现的 ModifiableDAWGSet 添加了一个递归方法。

getWords 使用字符串前缀调用,将字符相加。我首先实现了这个来生成 DAWG 中的所有单词,并与 ModifiableDAWGSet.getAllStrings() 的现有方法进行比较。然后我添加了跳过不包含单词的单词,不包括可能字符列表中的字符。

private ArrayList<String> allMatchingWords = new ArrayList<String>();
private ArrayList<Character> possibleCharacters;

private void getWords(ModifiableDAWGNode originNode, String prefix) {
    NavigableMap<Character, ModifiableDAWGNode> transitionTreeMap = originNode.getOutgoingTransitions();

    for(Map.Entry<Character, ModifiableDAWGNode> transition : transitionTreeMap.entrySet())
    {
        Character c = transition.getKey();
        if(!possibleCharacters.contains(c))
            continue;

        ModifiableDAWGNode n = transition.getValue();
        if(n.isAcceptNode()) //this is a word
        {
            allMatchingWords.add(prefix + c);
        }
        getWords(n, prefix + c);
    }
}

public ArrayList<String> getAllMatchingWords(Character mustContain, ArrayList<Character> possibleCharacters)
{
    allMatchingWords.clear();
    this.mustContain = mustContain;
    this.possibleCharacters = possibleCharacters;
    getWords(sourceNode, "");
    return allMatchingWords;
}
于 2020-05-02T08:43:20.233 回答
0

我有一个想法,我不确定,但希望能帮助你。首先创建字典作为工作键,键将是单词包含的所有字母,按字母顺序排列。例如:经典 -> acils ,字母 -> elrt。与随机字符串类似。你可以为你的程序准备这个。并获得浏览具有 O (n) 复杂度的字典所需的一切

for(Word word : dawg.getAllStrings()){
    if(randomString.contains(word.getKey()))
    possibleWordList.add(word);
}
于 2020-04-29T18:12:15.663 回答