我收到的 XML 文件可能格式不正确,在这种情况下我需要忽略它们。
我正在使用包装 xmerl 的 SweetXml。
我有一个格式错误的 XML 示例,它在两个属性之间没有空格。
没有 is_well_formed 函数 - 具有简单布尔响应的函数会很棒。
Xmerl 尝试解析文件,但不喜欢它,因此发送退出。
我还没有了解主管,但在我看来,这对他们来说是一个案例。
是否有处理该退出信号的新手或简单方法?
defmodule XmlIsWellFormed.WellFormed do
def is_well_formed(xml) do
import SweetXml
xml_string = to_string xml
result = xml_string |> parse # parse sends exit.
# FYI - SweetXml.parse :
# def parse(doc) do
# {parsed_doc, _} = :xmerl_scan.string(doc)
# parsed_doc
# end
# Note: inspecting result is no use because xmerl sends an exit with:
# "whitespace_required_between_attributes"
# Something like this would be handy:
# try do
# result = :xmerl_scan.string(xml)
# rescue
# :exit, _ -> nil
# end
end
end
rubbish_xml = '<rubbishml><html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="en-US"xmlns:og="http://ogp.me/ns#" xmlns:fb="http://www.facebook.com/2008/fbml"></rubbishml>'
XmlIsWellFormed.WellFormed.is_well_formed rubbish_xml