6

我在使用 sax 解析器时遇到了(我认为是)一种奇怪的行为,我想知道它是否正常。

我通过 SAX 解析器发送这个 XML:

<site url="http://example.com/?a=b&amp;b=c"; />

startElement调用回调时,“&”将转换为“&” 。它应该这样做吗?如果是这样,我想了解原因。

我在此处粘贴了一个示例来演示该问题:

#include <stdlib.h>
#include <libxml/parser.h>

static void start_element(void * ctx, const xmlChar *name, const xmlChar **atts)
{
  int i = 0;
  while(atts[i] != NULL) {
    printf("%s\n", atts[i]);
    i++;
  }
}

int main(int argc, char *argv[]) {
  xmlSAXHandlerPtr handler = calloc(1, sizeof(xmlSAXHandler));
  handler->startElement = start_element;

  char * xml = "<site url=\"http://example.com/?a=b&amp;b=c\" />";

  xmlSAXUserParseMemory( handler,
                          NULL,
                          xml,
                          strlen(xml)
  );
}

PS:此消息实际上是从LibXML2 列表中提取的……而且我不是此邮件的最初作者,但我注意到使用Nokogiri的问题,并且Aaron(Nokogiri 的维护者)实际上自己发布了此消息。

4

1 回答 1

5

这条消息描述了同样的问题(我也有),回复

要求解析器替换实体值

这意味着当您设置上下文时,请设置如下选项:

xmlParserCtxtPtr context = xmlCreatePushParserCtxt(&yourSAXHandlerStruct, self, NULL, 0, NULL);
xmlCtxtUseOptions(context, XML_PARSE_NOENT);
于 2009-09-02T16:17:23.820 回答