问题标签 [tre-library]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c - Finding multiple regex hits using approximate matching via the tre library
Using C, I'm trying to find the location and number of matches of a substring within another parent string. Because I also need to include approximate (hamming distance) matches, I'm using the tre library found here: http://laurikari.net/tre/.
I'm having trouble understanding some of the documentation on the site, likely because I'm not too familiar with regex lingo. According to the tre documentation, I can get more specific information about 'submatches'. Are these the matches I'm looking for?
Thanks!
regex - 模糊正则表达式
在我的工作中,我使用了近似字符串匹配算法(例如 Damerau-Levenshtein 距离)来使我的代码不易受到拼写错误的影响,取得了很好的效果。
现在我需要将字符串与简单的正则表达式进行匹配,例如TV Schedule for \d\d (Jan|Feb|Mar|...)
. 这意味着字符串TV Schedule for 10 Jan
应该返回 0 而T Schedule for 10. Jan
应该返回 2。
这可以通过在正则表达式中生成所有字符串(在本例中为 100x12)并找到最佳匹配来完成,但这并不实用。
你有什么想法如何有效地做到这一点?
php - 从 php 加载 c 库
在最近的一个项目中,我真的需要 lib tre 匹配库。
但是该项目是在 php 中的,并且该库没有 php 绑定。
我试图用谷歌搜索如何为 c 库创建一个接口,但我发现的只是dl
接缝只加载 php 扩展的函数。
我错过了什么?
python - 使用 TRE 在 python 中近似正则表达式:奇怪的 unicode 行为
我正在尝试在 python 中使用TRE -library 来匹配拼写错误的输入。
重要的是,它确实可以很好地处理 utf-8 编码的字符串。
一个例子:
德国首都的名字是柏林,但从发音上看是一样的,如果人们写“Bärlin”
到目前为止它正在工作,但如果非 ASCII 字符位于检测到的字符串的第一个或第二个位置,则范围和检测到的字符串本身都不正确。
输出
并不是说对于正则表达式'.*Berlin'
它工作正常,而对于正则表达式'Berlin'
不工作,而
按预期工作。
我的编码有什么问题吗?你知道什么诀窍吗?