说我有一个字符串
local a = "Hello universe"
我找到子字符串“宇宙”
a:find("universe")
现在,假设字符串是
local a = "un#verse"
要搜索的字符串是universe;但子字符串相差一个字符。所以显然 Lua 忽略了它。
即使单个字符存在差异,如何使函数找到字符串?
说我有一个字符串
local a = "Hello universe"
我找到子字符串“宇宙”
a:find("universe")
现在,假设字符串是
local a = "un#verse"
要搜索的字符串是universe;但子字符串相差一个字符。所以显然 Lua 忽略了它。
即使单个字符存在差异,如何使函数找到字符串?
如果您知道该字符的位置,请使用.
该字符代替:a:find("un.verse")
但是,看起来您正在寻找模糊字符串搜索。它超出了 Luastring
库的范围。您可能想从这篇文章开始:http: //ntz-develop.blogspot.com/2011/03/fuzzy-string-search.html
至于 Lua 模糊搜索实现——我没有使用过,但是搜索“lua 模糊搜索”会给出一些结果。有些是基于这篇论文:http ://web.archive.org/web/20070518080535/http://www.heise.de/ct/english/97/04/386/
一个简单的滚动你自己的方法(基于模式保持相同长度的假设):
function hammingdistance(a,b)
local ta={a:byte(1,-1)}
local tb={b:byte(1,-1)}
local res = 0
for k=1,#a do
if ta[k]~=tb[k] then
res=res+1
end
end
print(a,b,res) -- debugging/demonstration print
return res
end
function fuz(s,pat)
local best_match=10000
local best_location
for k=1,#s-#pat+1 do
local cur_diff=hammingdistance(s:sub(k,k+#pat-1),pat)
if cur_diff < best_match then
best_location = k
best_match = cur_diff
end
end
local start,ending = math.max(1,best_location),math.min(best_location+#pat-1,#s)
return start,ending,s:sub(start,ending)
end
s=[[Hello, Universe! UnIvErSe]]
print(fuz(s,'universe'))
免责声明:不推荐,只是为了好玩:
如果你想要一个更好的语法(并且你不介意弄乱标准类型的元表),你可以使用这个:
getmetatable('').__sub=hammingdistance
a='Hello'
b='hello'
print(a-b)
但请注意,a-b
不等于b-a
这种方式。
如果您真的在寻找单个字符差异并且不关心性能,那么这是一个应该有效的简单方法:
local a = "Hello un#verse"
local myfind = function(s,p)
local withdot = function(n)
return p:sub(1,n-1) .. '.' .. p:sub(n+1)
end
local a,b
for i=1,#s do
a,b = s:find(withdot(i))
if a then return a,b end
end
end
print(myfind(a,"universe"))