1

这个问题是关于如何使用xmlns属性等解析 xml 内容。我编写了代码来解析它的工作原理。我会很感激关于它是否可以做得更好的指针。

我有一个test.xml如下的 XML 文件:

<?xml version="1.0" encoding="utf-8"?><soap:Envelope xmlns:soap="http://schemas.xmlsoap.org/soap/envelope/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema"><soap:Body>
<SomeResponse xmlns="https://testsomestuff.org/API/WS/">
 <SomeResult>
&lt;html&gt;
    &lt;head&gt;
        &lt;title&gt;My &lt;b&gt;Title&lt;/b&gt;&lt;/title&gt;
    &lt;/head&gt;
    &lt;body&gt;
        &lt;p&gt;Foo bar baz&lt;/p&gt;
    &lt;/body&gt;
&lt;/html&gt;
 </SomeResult>
</SomeResponse>
</soap:Body></soap:Envelope>

我使用以下代码编写了解析“SomeResult”内容的代码xml-conduit

{-# LANGUAGE OverloadedStrings #-}
import Prelude hiding (readFile)
import Text.XML
import Text.XML.Cursor
import qualified Data.Text as T
import Data.Text.Lazy.Builder (toLazyText)
import Data.Text.Lazy (fromStrict)

main :: IO ()
main = do
    doc <- readFile def "test.xml"
    let cursor = fromDocument doc
        res = fromStrict $ T.concat $ child cursor >>= laxElement "Body" >>= child >>= laxElement "SomeResponse" >>= child >>= laxElement "SomeResult" >>= descendant >>= content
        pres = parseText_ def res
        cursor2 = fromDocument pres
        res2 = child cursor2 >>= element "head" >>= child >>= element "title" >>= descendant >>= content
    print $ res2

中的输出ghci:正确解析:

*Main> main
["My ","Title"]

laxElement定位内容的方法是SomeResult好方法吗?如果有更好的方法,我将非常感谢这方面的指点。

此外,我需要反向进行 http 编码(在构建上述响应的请求时),其中内部主体被转义(如SomeResultin下text.xml)。这是在使用构建请求时默认处理的事情Text.XML,还是我必须使用html-entities 之类的东西将内部主体显式转换为转义的 http ?

4

1 回答 1

1

与 一起xml-conduit,我建议使用小型“镜头”包,例如xml-html-conduit-lensxml-lens(两者非常相似,但在快速浏览源代码后我选择了第一个)。支持命名空间(请参阅此问题

如果您需要更具体的示例,可以查看我的一个实验项目。在那个项目中,下面是从 VCloud API 获取特定机器信息的遍历:

fetchVM :: AsXmlDocument t => Text -> Traversal' t Element
fetchVM n = xml...ovfNode "VirtualSystem".attributed (ix (nsName ovfNS "id").only n)

然后,您可以像这样组合遍历:

vmId = raw ^. responseBody . fetchVM vmName . fetchVmId.text

查看如何定义ovhNodensName定义以了解我如何处理命名空间。

这是关于该主题的另一篇有趣的文章: https ://www.schoolofhaskell.com/user/chad/snippets/random-code-snippets/xml-conduit-lens

另一个技巧是坚持使用“xml-conduit”(至少现在是这样)。有些人建议taggy作为替代品,但不幸的是它目前不在积极的开发周期中(参见https://github.com/alpmestan/taggy/issues/14

我希望它有所帮助。

于 2016-03-08T21:30:02.570 回答