我正在开发一个小型搜索引擎来显示具有完整路径的匹配文件名。重要的是我需要提供通配符(GLOB)搜索,例如*.doc
或*list*.xlx
或*timesheet*
或???.doc
或类似的东西。
我找到了一些相关的解决方案
在小于 O(n) 的时间内搜索匹配模式“abc:*:xyz”的字符串
但我正在寻找有效的算法,它可以在不到一秒的时间内从数百万个文件名中找到匹配项,因此需要比 O(n) 更好。
我正在考虑在第一阶段使用子字符串数组(后缀数组+前缀数组)搜索和通过第一阶段第二阶段的结果进行正常正则表达式搜索的两阶段算法。
任何帮助将不胜感激...