fparsec - 为什么 FParsec 使用列表？

Question

我想我会尝试使用 FParsec 编写一个快速解析器，并很快意识到many返回列表是一个严重的性能问题。ResizeArray然后我发现了一个在文档中使用 a 的替代方法：

let manyA2 p1 p =
    Inline.Many(firstElementParser = p1,
                elementParser = p,
                stateFromFirstElement = (fun x0 ->
                                             let ra = ResizeArray<_>()
                                             ra.Add(x0)
                                             ra),
                foldState = (fun ra x -> ra.Add(x); ra),
                resultFromState = (fun ra -> ra.ToArray()),
                resultForEmptySequence = (fun () -> [||]))

let manyA p = manyA2 p p

在我的代码中使用它会使其运行速度提高几倍。那么为什么 FParsec 默认使用列表而不是ResizeArray?

score 6 · Accepted Answer

使用内置 F# 列表类型作为序列组合器的结果类型使组合器在 F# 中使用起来更加方便，并且可以说会导致更惯用的客户端代码。由于大多数 F# 开发人员重视简单和优雅而不是性能（至少在我的经验中），因此在我设计 API 时，使用列表作为默认值似乎是正确的选择。同时，我尝试让用户轻松定义自己的专用序列组合器。

目前，返回列表的序列组合器也在内部使用列表来构建序列。这对于具有超过 2 个元素的序列来说是次优的，因为列表必须在返回之前反转。但是，我不确定更改实现是否值得付出努力，因为如果您的解析器对性能敏感并且您正在解析长序列，那么您最好不要使用列表。

我可能应该在用户指南的性能章节中添加一个关于使用数组而不是列表的部分。

fparsec - 为什么 FParsec 使用列表？

1 回答 1

Related

Reference