6

我正在尝试解析 XML,但我想过滤并仅从给定节点中提取确定数量的子节点。例如:

<root>
    <node id="a" />
    <node id="b" />
    <node id="c" />
    <node id="d" />
</root>

然后,如果我执行箭头getChildren >>> myFilter 2,我将只取回 ID 为“a”和“b”的节点。

直觉告诉我应该使用状态箭头来跟踪,但我不知道该怎么做。

我试着自己做,但这不是我想要的,看起来不是很优雅,也不起作用。我尝试使用runSLA整数参数作为初始状态运行我的箭头链,然后定义:

takeOnly :: IOSLA Int XmlTree XmlTree
takeOnly = changeState (\s b -> s-1)
             >>> accessState (\s b -> if s >= 0 then b else Nothing)

但是我当然不能返回Nothing,我需要返回一个 XmlTree。但我根本不想退货!

那里可能有更好的方法。你能帮助我吗?

感谢您的时间和帮助!

4

1 回答 1

4

使用Control.Arrow.ArrowList中的组合器来处理这种事情可能会更惯用。

该包特别提供了(>>.) :: a b c -> ([c] -> [d]) -> a b d,它是一个“将列表箭头的结果转换为另一个列表的组合器”。这允许我们take在这个上下文中使用我们已经拥有的列表功能。

这是您如何使用它的快速版本:

module Main where

import Text.XML.HXT.Arrow

takeOnly :: (ArrowXml a) => Int -> a XmlTree XmlTree
takeOnly n = getChildren >>. take n 

main = do
  let xml = "<root><node id='a' /><node id='b' />\
                  \<node id='c' /><node id='d' /></root>"

  print =<< runX (readString [] xml >>> getChildren >>> takeOnly 2)

我相信这大约可以满足您的需求:

travis@sidmouth% ./ArrowTake
[NTree (XTag (LP node) [NTree (XAttr (LP id)) [NTree (XText "a") []]]) [],
 NTree (XTag (LP node) [NTree (XAttr (LP id)) [NTree (XText "b") []]]) []]

不需要IOSLA。请注意,我还稍微更改了函数类型——这个版本对我来说似乎更好,但您可以轻松地将其转换为更像您版本中的类型。

于 2011-03-03T10:16:36.437 回答