问题标签 [aho-corasick]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1252 浏览

java - 在 DAWG 而不是 Trie 上使用 Aho-Corasick

有人知道是否可以修改 Aho-Corasick 字符串匹配算法以用于 DAWG(有向无环词图)而不是 Trie 吗?

0 投票
4 回答
3571 浏览

algorithm - aho corasick 的可扩展性

我想从关键字数据库(从维基百科文章标题中提取)中搜索出现关键字的文本文档。(即给定一个文档,我想查找是否有任何短语有相应的维基百科文章)我发现了 Aho-Corasick 算法。我想知道为数百万条目的字典构建 Aho-Corasick 自动机是否高效且可扩展。

0 投票
3 回答
2672 浏览

algorithm - Aho-Corasick 和适当的子串

我试图理解 aho-corasick 字符串匹配算法。假设我们的模式是abcdbc。我们最终得到一棵这样的树

虚线表示失效函数。

现在假设我们输入字符串abcd。这将跟随树并检测匹配“abcd”,但是,据我所知,bc不会报告匹配。我误解了算法吗?

0 投票
1 回答
508 浏览

algorithm - 如何生成 Aho-Corasick 哈希

我最近开始开发一个开源防病毒软件,尽管哈希是使用 Aho-Corasick 算法生成的。

我很想知道如何从可执行文件中生成 Aho-Corasick 哈希,因为我在互联网上几乎找不到任何关于此的信息

0 投票
1 回答
1668 浏览

c++ - 用于反恶意软件代码的类似 Aho-Corasick 的算法

有没有像Aho-Corasick这样的算法,可以同时匹配一组模式,适用于反恶意软件比较?所有已知的商业防病毒软件都使用 Aho-Corasick 算法吗?

与Boyer-Moore相比,Aho-Corasick 算法有哪些优势?

0 投票
4 回答
2285 浏览

php - 更快的 Aho-Corasick PHP 实现

在 PHP中是否有Aho–Corasick的工作实现?Wikipedia 文章中提到的PHP 中有一个Aho-Corasick 字符串匹配:

但是我很难使用它。它适用于一个婴儿示例,但如果我尝试加载数千个关键字,那么脚本会超过 30 秒的加载限制。

对于其他脚本语言,有很好的实现,例如http://metacpan.org/pod/Text::Scan for Perl 和http://pypi.python.org/pypi/ahocorasick/0.9 for Python。为什么不用于 PHP?

0 投票
1 回答
311 浏览

c++ - 使用 aho-corasick 算法崩溃?

我在这里得到了 aho-corasick 算法的代码:http ://www.komodia.com/aho-corasick 。

我按照指南所说的那样使用它,添加了线条并构建了树。

然而,我确实将它从使用 std wstring 更改为 std string 但这无关紧要。我刚刚更改了typedef。

当我使用它并搜索某些东西时,如果没有找到结果就没有问题。找到结果后,我得到一个标准超出范围异常。

它在这里崩溃:

它在这里崩溃:

以下是变量:

在此处输入图像描述

我正在使用它在游戏中实施审查。

什么可能导致它崩溃?

我有一些字符串添加了两次,这会导致问题吗?

谢谢

0 投票
1 回答
1068 浏览

algorithm - 如何使用 Aho-Corasick 在给定的字符串集中查找一段文本?

我有 Aho-Corasick 算法的代码。但是我仍然不明白在给定字符串列表中搜索文本时如何在查找过程中使用状态信息。

例如,我有一个字符串列表[MOSCOW][COLA],现在我需要确定是否CA在列表中,如果是,它的位置是什么?

这是代码的链接

0 投票
4 回答
2389 浏览

java - 整个单词的 Aho-Corasick 文本匹配?

我正在使用 Aho-Corasick 文本匹配,想知道是否可以将其更改为匹配术语而不是字符。换句话说,我希望条款成为匹配的基础,而不是字符。举个例子:

搜索查询:“他”,

句子:“你好世界”,

Aho-Corasick 会将“he”匹配到以索引 2 结尾的句子“hello world”,但我宁愿不匹配。所以,我的意思是“术语”单词而不是字符。

0 投票
1 回答
1106 浏览

c++ - Aho-Corasick 算法

请帮我找出这段代码中的错误。我写了一个简单的程序,通过Aho-Corasick算法添加n个字符串来尝试,但它不能正常工作。输入字符串后它会崩溃。这段代码有什么问题?