问题标签 [tre-library]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
391 浏览

c - Finding multiple regex hits using approximate matching via the tre library

Using C, I'm trying to find the location and number of matches of a substring within another parent string. Because I also need to include approximate (hamming distance) matches, I'm using the tre library found here: http://laurikari.net/tre/.

I'm having trouble understanding some of the documentation on the site, likely because I'm not too familiar with regex lingo. According to the tre documentation, I can get more specific information about 'submatches'. Are these the matches I'm looking for?

Thanks!

0 投票
6 回答
23498 浏览

regex - 模糊正则表达式

在我的工作中,我使用了近似字符串匹配算法(例如 Damerau-Levenshtein 距离)来使我的代码不易受到拼写错误的影响,取得了很好的效果。

现在我需要将字符串与简单的正则表达式进行匹配,例如TV Schedule for \d\d (Jan|Feb|Mar|...). 这意味着字符串TV Schedule for 10 Jan应该返回 0 而T Schedule for 10. Jan应该返回 2。

这可以通过在正则表达式中生成所有字符串(在本例中为 100x12)并找到最佳匹配来完成,但这并不实用。

你有什么想法如何有效地做到这一点?

0 投票
3 回答
2348 浏览

php - 从 php 加载 c 库

在最近的一个项目中,我真的需要 lib tre 匹配库。

但是该项目是在 php 中的,并且该库没有 php 绑定。

我试图用谷歌搜索如何为 c 库创建一个接口,但我发现的只是dl接缝只加载 php 扩展的函数。

我错过了什么?

0 投票
3 回答
1323 浏览

python - 使用 TRE 在 python 中近似正则表达式:奇怪的 unicode 行为

我正在尝试在 python 中使用TRE -library 来匹配拼写错误的输入。
重要的是,它确实可以很好地处理 utf-8 编码的字符串。

一个例子:
德国首都的名字是柏林,但从发音上看是一样的,如果人们写“Bärlin”

到目前为止它正在工作,但如果非 ASCII 字符位于检测到的字符串的第一个或第二个位置,则范围和检测到的字符串本身都不正确。

输出

并不是说对于正则表达式'.*Berlin'它工作正常,而对于正则表达式'Berlin'

不工作,而

按预期工作。

我的编码有什么问题吗?你知道什么诀窍吗?