问题标签 [non-well-formed]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
3183 浏览

html - 在非格式良好的 HTML 中使用 XPath 查找节点(或靠近它)

我正在使用 XPath 在模板中定位一个节点(或接近它的东西),该模板具有大约 10 级深度的非格式良好的 HTML。(不,我没有写这个 HTML ......但我的任务是挖掘它。)

我似乎能够使用 Firefox 的 XPartner 附加组件检索相关元素的 XPath;但是它只给了我在实时站点中的位置,而不是在给我的模板中。(模板来自非标准的服务器端脚本语言;阅读内部构建的语言)

您知道有没有特别擅长处理非格式良好的 HTML 的 XPath 工具。

0 投票
1 回答
1147 浏览

xml - FTP 后 XML 文件中的“格式不正确”错误

使用 WS_FTP Professional,我有一个每天晚上运行的备份过程。

WS_FTP 基本上是通过windows scheduler 建立FTP 到远程服务器的进程。具体来说,它将大约 2.5 兆的 XML 文件发送到服务器以供下载。

我在 FTP 之前检查 XML 文件的格式是否正确,并且始终如此。我遇到的问题是通过我的备份过程将get上传到服务器后,xml文件的格式不正确。如果我下载文件并检查发生错误的行号,通常只有随机数字/字母、损坏的标签或“NULL”符号。

我检查了 WS_FTP 在发送文件之前没有压缩或加密文件,并且它以 ASCII 模式发送文件。

它发生了,似乎是随机的。有时上传工作正常,有时会出现错误。

如果我上传同一个文件 10 次,那么其中大约 8 次文件会出现错误,并且它们将始终出现在同一行 (6481)。文件每天更新​​,所以明天如果我上传文件,我会得到相同数量的错误,但它可能在不同的行上,几乎就像错误发生在一定数量的字符之后(如果这使得任何感觉)。

如果有人能理解这一点,我将不胜感激。它快把我逼疯了。

更新

我刚刚运行了几个测试,看起来它实际上发生在同一个字节上。

更新 2

问题出在 WS_FTP 上。不完全确定它是什么,但我尝试了一个不同的 FTP 客户端,它可以工作。

0 投票
3 回答
1512 浏览

xml - python xml错误

我是 xml 的新手。我正在尝试解析一个 xml 文件以从中提取数据,但是当我调用doc=minidom.parse('D:\\CONFIGRATION.xml')...

谁能帮帮我吗?什么是格式良好的 XML 文档?

提前致谢

0 投票
6 回答
42443 浏览

java - Java 说 XML 文档格式不正确

Java 的 XML 解析器似乎认为我的 XML 文档在根元素之后的格式不正确。但是我已经用几种工具对其进行了验证,但他们都不同意。这可能是我的代码中的错误,而不是文档本身中的错误。我真的很感激你们能提供给我的任何帮助。

这是我的Java方法:

以下是我尝试加载的 XML 文件:

这是java为我抛出的错误消息:

供参考 TodoListGUI.java:199 是

如果上下文对这里的任何人都有帮助,我正在尝试编写一个简单的 GUI 应用程序来管理一个 todo 列表,该列表可以读取和写入定义任务的 XML 文件。

0 投票
3 回答
911 浏览

java - 替换格式不正确的 XML 正文中的字符

在我正在处理的(Java)代码中,我有时会处理格式不正确的 XML(表示为 Java String),例如:

由于这个 XML 最终需要被解组(使用 JAXB),显然这个 XML 将在解组时抛出异常。

&将 the和 the替换<为其角色实体的最佳方法是什么?对于&,这很简单:

但是,对于<符号,它有点棘手,因为显然我不想替换<用于 XML 标记开头“括号”的那个。

除了扫描字符串并<在 XML 正文中手动替换为&lt;之外,您还能建议什么其他选项?

0 投票
3 回答
2616 浏览

java - 如何确定 HTML 文档在 JAVA 中是否格式正确?

嘿,伙计们,我需要确定给定的 HTML 文档是否格式正确。
我只需要一个简单的实现,只使用 Java 核心 API 类,即没有 JTIDY 之类的第三方东西。谢谢。

实际上,真正需要的是一种扫描 TAGS 列表的算法。如果它找到一个打开标签,而下一个标签不是它对应的关闭标签,那么它应该是另一个打开标签,而它又应该将其关闭标签作为下一个标签,如果没有,它应该是另一个打开标签,然后其对应的关闭标签下一个,并且前一个打开标签的关闭标签以相反的顺序出现在列表中的下一个。我已经编写了将标签转换为关闭标签的方法。如果列表符合此顺序,则返回 true 或 false。

这是我已经开始工作的框架代码。它不是太整洁,但它应该让你们对我正在尝试做的事情有一个基本的了解。

0 投票
1 回答
1728 浏览

java - HTML 格式良好的解析器

嘿,伙计们,我需要确定给定的 HTML 文档是否格式正确。
我只需要一个简单的实现,只使用 Java 核心 API 类,即没有 JTIDY 之类的第三方东西。

实际上,真正需要的是一种扫描 TAGS 列表的算法。如果它找到一个打开标签,而下一个标签不是它对应的关闭标签,那么它应该是另一个打开标签,而它又应该将其关闭标签作为下一个标签,如果没有,它应该是另一个打开标签,然后其对应的关闭标签下一个,并且前一个打开标签的关闭标签以相反的顺序在列表中一个接一个地出现。如果列表符合此顺序,则返回 true 或 false。我已经编写了将标签转换为关闭标签的方法。

这是我已经开始工作的框架代码。它不是太整洁,但它应该让你们对我正在尝试做的事情有一个基本的了解。

0 投票
2 回答
177 浏览

.net - 在 .NET3.5 中处理格式错误的 XML

给定一个通过 TCP 将 XML 流式传输给我的第三方系统。总传输的 XML 内容(不是流中的一条消息,而是串联的消息)如下所示:

上述样本的每一行都可以单独处理。由于它是一个流式处理,我不能等到一切都来了,我必须在内容到来时处理它。问题是内容块可以按任意点切片,不尊重任何标签。如果内容以这样的片段形式到达,您对如何处理内容有什么好的建议吗?

块 1:


块 2:


块 N:

编辑:

虽然处理速度不是问题(没有实时问题),但我不能等待整个消息。实际上最后一个块永远不会到达。第三方系统在遇到变化时发送消息。这个过程永远不会结束,它是一条永不停止的流。

0 投票
2 回答
1653 浏览

android - 无法在android上读取xml文件

我正在尝试使用 jdom 打开和读取 xml 文件作为本地资源。我可以打开该文件,但随后我收到一条错误消息,提示该 xml 文件格式不正确。这是代码:

我收到以下错误:

这是包含我的数据的 xml 文件:

你有什么想法吗?提前致谢。

0 投票
3 回答
4392 浏览

asp.net - ASP.NET 链接按钮 服务器标记格式不正确

我试图在我的网格视图中添加一个按钮,它将我重定向到另一个页面并传递电影的 id。这是我的代码

不久前在另一个应用程序中,我使用了类似的代码,并且运行良好

是因为我使用了不同的标签,还是因为 url ?