1

我收到的 XML 文件可能格式不正确,在这种情况下我需要忽略它们。

我正在使用包装 xmerl 的 SweetXml。

我有一个格式错误的 XML 示例,它在两个属性之间没有空格。

没有 is_well_formed 函数 - 具有简单布尔响应的函数会很棒。

Xmerl 尝试解析文件,但不喜欢它,因此发送退出。

我还没有了解主管,但在我看来,这对他们来说是一个案例。

是否有处理该退出信号的新手或简单方法?

defmodule XmlIsWellFormed.WellFormed do
  def is_well_formed(xml) do
    import SweetXml
    xml_string = to_string xml
    result = xml_string |> parse # parse sends exit.

    # FYI - SweetXml.parse :
    # def parse(doc) do
    #     {parsed_doc, _} = :xmerl_scan.string(doc)
    #     parsed_doc
    # end

    # Note:     inspecting result is no use because xmerl sends an exit with:
    #           "whitespace_required_between_attributes"

    # Something like this would be handy:
    # try do
    #     result = :xmerl_scan.string(xml)
    # rescue
    #     :exit, _ -> nil
    # end
  end
end

rubbish_xml = '<rubbishml><html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="en-US"xmlns:og="http://ogp.me/ns#" xmlns:fb="http://www.facebook.com/2008/fbml"></rubbishml>'
XmlIsWellFormed.WellFormed.is_well_formed rubbish_xml
4

1 回答 1

5
于 2014-11-05T08:09:44.190 回答