我将如何在 Lua 中进行多模式搜索?(我设置了 Lpeg)。
例如,假设我连续接收字符串,我一次处理一个,将它们捕获并调用它们msg
。现在我想获取msg
并检查它是否具有以下任何模式:MUFFIN MOOPHIN MUPHEN M0FF1N
首先。我如何检查是否msg
有任何这些(如果它不止一个则无关紧要)而不必写一个巨大的if(or or or or)
?
您可以做的一件事是制作一个要查找的单词表,然后使用它gmatch
来迭代字符串中的每个单词并检查它是否在该表中。
#!/usr/bin/env lua
function matchAny(str, pats)
for w in str:gmatch('%S+') do
if pats[w] then
return true
end
end
return false
end
pats = {
['MUFFIN'] = true,
['MOOPHIN'] = true,
['MUPHEN'] = true,
['M0FF1N'] = true,
}
print(matchAny("I want a MUFFIN", pats)) -- true
print(matchAny("I want more MUFFINs", pats)) -- false
一个迟到的答案,但您可以构造一个模式以不区分大小写地匹配所有单词(仅当后面没有字母时),捕获主题中的匹配位置和与以下内容匹配的单词索引:
local lpeg = require("lpeg")
local function find_words(subj, words)
local patt
for idx, word in ipairs(words) do
word = lpeg.P(word:upper()) * lpeg.Cc(idx)
patt = patt and (patt + word) or word
end
local locale = lpeg.locale()
patt = lpeg.P{ lpeg.Cp() * patt * (1 - locale.alnum) + 1 * lpeg.V(1) }
return patt:match(subj:upper())
end
local words = { "MUFFIN", "MOOPHIN", "MUPHEN", "M0FF1N" }
local pos, idx = find_words("aaaaa bbb ccc muPHEN ddd", words)
-- output: 16, 3