问题标签 [sax]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Sax 解析器:忽略 HTML
我正在使用 sax 解析器来解析 XML 文件。它工作正常,但我不想解析<info>
标签的内容,因为它包含我想保存到字符串的 HTML。谁能告诉我有什么办法可以做到这一点吗?
谢谢
java - Sax 解析和编码
我有一个联系人在解析 RSS 和 Atom 文件时遇到了 SAX 问题。据他说,就好像来自 Item 元素的文本在撇号或有时是重音字符处被截断。编码似乎也有问题。
我已经尝试过 SAX,我也进行了一些截断,但无法进一步挖掘。如果有人以前解决过这个问题,我会很感激一些建议。
这是 ContentHandler 中使用的代码:
编辑:编码问题可能是由于将信息存储在字节数组中,因为我知道 Java 在 Unicode 中工作。
python - 使用 DTD(python)从 Sax 到 Dom
我需要一个经过验证的带有 DTD 的 DomTree(使用getElementById
)。验证和解析有效,但 dom 不能正常工作:
似乎 SAX2DOM 不会将 DTD 传递给 dom。我忘了什么吗?我读过在构建 dom 后无法加载 DTD。
有任何想法吗?
java - 巨大的 XML 文件:我是否每次都读取“页面”并处理它?
我需要处理一个巨大的 XML 文件,4G。我使用 dom4j SAX,但编写了自己的 DefaultElementHandler。代码框架如下:
我以为我正在按“页面”处理巨大的文件“页面”。但似乎不是,因为我总是遇到内存不足错误。我错过了什么重要的事情吗?谢谢。我是 XML 流程的新手。
java - Java:将 StreamResult 保存到文件中
我正在使用 SAX 将一些数据转换(如 csv)转换为 xml,然后在 Java 中使用转换器。结果在 StreamResult 中,我正在尝试将此结果保存到 file.xml 但我找不到将 StreamResult 保存到文件中的方法。我做错了吗?
java - 使用 java sax 生成 xml 属性时遇到问题
我在 java 中使用 SAX api 将 csv 转换为 xml。我可以生成一个没有属性的简单 xml 文件
但我找不到将 id 和数量设置为 item 元素的属性的方法,比如
所有 SAX api 似乎提供的是startElement
,character
和endElement
方法。(我知道attribute
这些方法中有参数,但我似乎根本无法设置属性)。
java - Android中的SAX解析问题......空元素?
我正在使用 SAX 解析我从网络上提取的 XML 文件。我使用类似于以下的代码扩展了DefaultHandler :
我遇到的问题是我得到了一系列空元素。日志内容如下:
当我只是传递parser.parse
一个本地文件时,这很好用,但现在我将它从网上拉出来:
我得到了上面描述的(显然)空结果。
到目前为止我所调查的:
- 我将
InputStream
from转换resp.getEntity().getContent()
为字符串并将其转储出来,看起来我正确地从服务器获取 XML。 - 没有抛出异常,但有一条警告显示为“
W/ExpatReader(232): DTD handlers aren't supported.
”。
关于我做错了什么或如何调试它的任何其他想法?
xml - Android XML 解析省略“&”
问题再次是,虽然我已经在我的代码中成功地实现了一个 SAX 解析器......它的行为很奇怪。它只是跳过 & 之后的条目并转到下一个条目。只是想知道这是 SAX 解析器的典型工作还是错误地实现它???
我已经实现了 org.xml.sax.ContentHandler 并在里面提供了以下编码......
`
`
有些元素带有标签 ,,,... 并且 m 将这些信息放入向量中...这是正确的吗?
现在又一个问题是我无法解析像“$”这样的特殊字符等等......有什么办法可以捕捉到这些字符?
java - 从 JAXP SAX ContentHandler 发出 XML 的最节省内存的方法是什么?
我的情况类似于早期关于发出 XML 的问题。我正在分析 SAX ContentHandler 中的数据,同时将其序列化为流。我怀疑链接问题中的解决方案——尽管它正是我在 API 方面正在寻找的解决方案——不是内存效率的,因为它涉及使用 XSLT 处理器的身份转换。我希望程序的内存消耗是有界的,而不是随着输入大小而增长。
如何轻松地将参数转发到我的 ContentHandler 方法到序列化程序,而无需进行杂技以适应例如 StAX 到 SAX,或者更糟糕的是,将 SAX 事件内容复制到输出流?
编辑:这是我所追求的最小示例。thingIWant
应该只写入给它的 OutputStream。就像我说的,前面的问题有一个 TransformerHandler,它为我提供了正确的 API,但它使用 XSLT 处理器而不是简单的序列化。
java - 编码问题
我必须解析从网络上获得的内容,它可以包含特殊字符。在这种情况下,内容字符串如下所示:
当上面的内容被传递给方法 characters() 时,在从 org.xml.sax.helpers.DefaultHandler 扩展的类中:
我注意到该数组test ž test
被分成三个数组:“test”、“ ž
”和“test”,所以 elementValue 不相等 test ž test
,应该是结果。有谁知道如何解决这个问题?
是否需要重新编码源字符串:
在传递给 XML 处理程序类之前?
谢谢!