8

给定一个带有一些空行的多行字符串,我如何遍历 Lua 中的行,包括空行

local s = "foo\nbar\n\njim"
for line in magiclines(s) do
  print( line=="" and "(blank)" or line)
end
--> foo
--> bar
--> (blank)
--> jim

此代码不包括空行:

for line in string.gmatch(s,'[^\r\n]+') do print(line) end
--> foo
--> bar
--> jim

此代码包含额外的虚假空行:

for line in string.gmatch(s,"[^\r\n]*") do
  print( line=="" and "(blank)" or line)
end
--> foo
--> (blank)
--> bar
--> (blank)
--> (blank)
--> jim
--> (blank)
4

6 回答 6

9

尝试这个:

function magiclines(s)
        if s:sub(-1)~="\n" then s=s.."\n" end
        return s:gmatch("(.-)\n")
end
于 2013-10-12T01:40:41.280 回答
4

这是另一种lPeg解决方案,因为我似乎是在与 phg 一起编写它的。不过既然语法更漂亮,我还是给你吧!

local lpeg = require "lpeg"
local C, V, P = lpeg.C, lpeg.V, lpeg.P

local g = P({ "S",
    S = (C(V("C")^0) * V("N"))^0 * C(V("C")^0),
    C = 1 - V("N"),
    N = P("\r\n") + "\n\r" + "\n" + "\r",
})

像这样使用它:

local test = "Foo\n\nBar\rfoo\r\n\n\n\rbar"
for k,v in pairs({g:match(test)}) do
    print(">", v);
end

或者只是print(g:match(test))当然

于 2013-10-12T12:30:44.440 回答
4

这是使用 LPEG 的解决方案:

local lpeg      = require "lpeg"
local lpegmatch = lpeg.match
local P, C      = lpeg.P, lpeg.C

local iterlines
do
  local eol  = P"\r\n" + P"\n\r" + P"\n" + P"\r"
  local line = (1 - eol)^0
  iterlines = function (str, f)
    local lines = ((line / f) * eol)^0 * (line / f)
    return lpegmatch (lines, str)
  end
end

你得到的是一个可以用来代替迭代器的函数。它的第一个参数是你要迭代的字符串,第二个是每个匹配的动作:

--- print each line
iterlines ("foo\nbar\n\njim\n\r\r\nbaz\rfoo\n\nbuzz\n\n\n\n", print)

--- count lines while printf
local n = 0
iterlines ("foo\nbar\nbaz", function (line)
  n = n + 1
  io.write (string.format ("[%2d][%s]\n", n, line))
end)
于 2013-10-12T12:13:26.850 回答
3

看看这个magiclines实现是否适合你的账单:

local function magiclines( str )
    local pos = 1;
    return function()
        if not pos then return nil end
        local  p1, p2 = string.find( str, "\r?\n", pos )
        local line
        if p1 then
            line = str:sub( pos, p1 - 1 )
            pos = p2 + 1
        else
            line = str:sub( pos )
            pos = nil
        end
        return line
    end
end

您可以使用以下代码对其进行测试:

local text = [[
foo
bar

jim

woof
]]


for line in magiclines( text ) do
    print( line=="" and "(blank)" or line)
end

输出:

富
酒吧
(空白的)
吉姆
(空白的)
纬
(空白的)
于 2013-10-11T20:59:57.130 回答
2

以下模式应匹配包括空行在内的每一行,并带有一个警告:字符串必须包含终止CRor LF

local s = "foo\nbar\n\njim\n" -- added terminating \n

for line in s:gmatch("([^\r\n]*)[\r\n]") do
   print(line == "" and "(blank)" or line)
end

--> foo
--> bar
--> (blank)
--> jim

不需要尾随CRLF将产生一个空白行作为最后一行的替代模式(因为可以不捕获任何内容)。

local s = "foo\nbar\n\njim"

for line in s:gmatch("([^\r\n]*)[\r\n]?") do
   print(line == "" and "(blank)" or line)
end

--> foo
--> bar
--> (blank)
--> jim
--> (blank)
于 2013-10-11T21:42:55.850 回答
-1

稍微优化了@lhf 的回答:

function magiclines(s)
    return s:gmatch("(.-)$")
end
于 2019-11-14T11:02:30.517 回答