问题标签 [sax]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
1434 浏览

java - Sax 解析器:忽略 HTML

我正在使用 sax 解析器来解析 XML 文件。它工作正常,但我不想解析<info>标签的内容,因为它包含我想保存到字符串的 HTML。谁能告诉我有什么办法可以做到这一点吗?

谢谢

0 投票
3 回答
6164 浏览

java - Sax 解析和编码

我有一个联系人在解析 RSS 和 Atom 文件时遇到了 SAX 问题。据他说,就好像来自 Item 元素的文本在撇号或有时是重音字符处被截断。编码似乎也有问题。

我已经尝试过 SAX,我也进行了一些截断,但无法进一步挖掘。如果有人以前解决过这个问题,我会很感激一些建议。

这是 ContentHandler 中使用的代码:

编辑:编码问题可能是由于将信息存储在字节数组中,因为我知道 Java 在 Unicode 中工作。

0 投票
1 回答
719 浏览

python - 使用 DTD(python)从 Sax 到 Dom

我需要一个经过验证的带有 DTD 的 DomTree(使用getElementById)。验证和解析有效,但 dom 不能正常工作:

似乎 SAX2DOM 不会将 DTD 传递给 dom。我忘了什么吗?我读过在构建 dom 后无法加载 DTD。

有任何想法吗?

0 投票
3 回答
323 浏览

java - 巨大的 XML 文件:我是否每次都读取“页面”并处理它?

我需要处理一个巨大的 XML 文件,4G。我使用 dom4j SAX,但编写了自己的 DefaultElementHandler。代码框架如下:

我以为我正在按“页面”处理巨大的文件“页面”。但似乎不是,因为我总是遇到内存不足错误。我错过了什么重要的事情吗?谢谢。我是 XML 流程的新手。

0 投票
2 回答
24595 浏览

java - Java:将 StreamResult 保存到文件中

我正在使用 SAX 将一些数据转换(如 csv)转换为 xml,然后在 Java 中使用转换器。结果在 StreamResult 中,我正在尝试将此结果保存到 file.xml 但我找不到将 StreamResult 保存到文件中的方法。我做错了吗?

0 投票
1 回答
2033 浏览

java - 使用 java sax 生成 xml 属性时遇到问题

我在 java 中使用 SAX api 将 csv 转换为 xml。我可以生成一个没有属性的简单 xml 文件

但我找不到将 id 和数量设置为 item 元素的属性的方法,比如

所有 SAX api 似乎提供的是startElement,characterendElement方法。(我知道attribute这些方法中有参数,但我似乎根本无法设置属性)。

0 投票
1 回答
3977 浏览

java - Android中的SAX解析问题......空元素?

我正在使用 SAX 解析我从网络上提取的 XML 文件。我使用类似于以下的代码扩展了DefaultHandler :

我遇到的问题是我得到了一系列空元素。日志内容如下:

当我只是传递parser.parse一个本地文件时,这很好用,但现在我将它从网上拉出来:

我得到了上面描述的(显然)空结果。

到目前为止我所调查的:

  1. 我将InputStreamfrom转换resp.getEntity().getContent()为字符串并将其转储出来,看起来我正确地从服务器获取 XML。
  2. 没有抛出异常,但有一条警告显示为“ W/ExpatReader(232): DTD handlers aren't supported.”。

关于我做错了什么或如何调试它的任何其他想法?

0 投票
2 回答
2406 浏览

xml - Android XML 解析省略“&”

问题再次是,虽然我已经在我的代码中成功地实现了一个 SAX 解析器......它的行为很奇怪。它只是跳过 & 之后的条目并转到下一个条目。只是想知道这是 SAX 解析器的典型工作还是错误地实现它???

我已经实现了 org.xml.sax.ContentHandler 并在里面提供了以下编码......

`

`

有些元素带有标签 ,,,... 并且 m 将这些信息放入向量中...这是正确的吗?

现在又一个问题是我无法解析像“$”这样的特殊字符等等......有什么办法可以捕捉到这些字符?

0 投票
3 回答
5634 浏览

java - 从 JAXP SAX ContentHandler 发出 XML 的最节省内存的方法是什么?

我的情况类似于早期关于发出 XML 的问题。我正在分析 SAX ContentHandler 中的数据,同时将其序列化为流。我怀疑链接问题中的解决方案——尽管它正是我在 API 方面正在寻找的解决方案——不是内存效率的,因为它涉及使用 XSLT 处理器的身份转换。我希望程序的内存消耗是有界的,而不是随着输入大小而增长。

如何轻松地将参数转发到我的 ContentHandler 方法到序列化程序,而无需进行杂技以适应例如 StAX 到 SAX,或者更糟糕的是,将 SAX 事件内容复制到输出流?

编辑:这是我所追求的最小示例。thingIWant应该只写入给它的 OutputStream。就像我说的,前面的问题有一个 TransformerHandler,它为我提供了正确的 API,但它使用 XSLT 处理器而不是简单的序列化。

0 投票
3 回答
337 浏览

java - 编码问题

我必须解析从网络上获得的内容,它可以包含特殊字符。在这种情况下,内容字符串如下所示:

当上面的内容被传递给方法 characters() 时,在从 org.xml.sax.helpers.DefaultHandler 扩展的类中:

我注意到该数组test &#382; test被分成三个数组:“test”、“ &#382;”和“test”,所以 elementValue 不相等 test &#382; test,应该是结果。有谁知道如何解决这个问题?

是否需要重新编码源字符串:

在传递给 XML 处理程序类之前?

谢谢!