在我的工作中,我使用了近似字符串匹配算法(例如 Damerau-Levenshtein 距离)来使我的代码不易受到拼写错误的影响,取得了很好的效果。
现在我需要将字符串与简单的正则表达式进行匹配,例如TV Schedule for \d\d (Jan|Feb|Mar|...)
. 这意味着字符串TV Schedule for 10 Jan
应该返回 0 而T Schedule for 10. Jan
应该返回 2。
这可以通过在正则表达式中生成所有字符串(在本例中为 100x12)并找到最佳匹配来完成,但这并不实用。
你有什么想法如何有效地做到这一点?