问题标签 [tag-soup]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
198 浏览

asp.net - 有哪些选项可以确定我的 ASP.NET MVC 视图是否不兼容 XHTML

澄清:感谢验证 XHTML 的工具的建议。我主要是在寻找一个可以在服务器端(或在客户端使用 jQuery)运行的解决方案,这样我就可以在开发过程中设置它并忘记它——当我遇到问题时被告知,而不必一直运行工具。


所有这些标签汤的东西都让我害怕 ASP.NET MVC !

如果我可以验证来自我的视图生成器的每个视图是否符合 XHTML,我就不会那么害怕了。这对于我计划编写的大量 jQuery 尤其重要。我不想花几个小时调试某些东西,只是为了发现我在某处有一个未关闭的标签,它阻止了选择器的工作。

有什么选择。在我的脑海中,我正在寻找类似以下的解决方案,但不确定其中哪些是实用的:

  • JQuery XHTML 检查器
  • IIS 过滤器
  • 浏览器插件(我假设 Firebug 插件可以做到这一点)
  • 用 MVC 视图类做一些聪明的事情(我不确定这是否可能或值得说服)。
  • 修改 HTML 编写器以检查“flush()”并在输出不是 XHTML 时抛出异常。
  • 我不知道要验证页面的 ASP.NET 配置选项。

所有选项欢迎回答!

我更喜欢服务器端技术,因此在调试期间我可以抛出一个硬异常,并且在生产中我可以记录任何错误。它必须在应用母版页后验证整个页面。在 IDE 中寻找警告并不是一个足够好的解决方案!

0 投票
3 回答
2229 浏览

java - Tagsoup 无法从 StringReader (java) 解析 html 文档

我有这个功能:

它需要一个字符串,其中包含 HTTP 服务器在 POST 请求后发送的 html 文档,但无法正确解析它 - 我只从整个文档中获得了四个节点。字符串本身看起来不错 - 如果我将其打印出来并将其复制到文本文档中,我会看到我期望的页面。

当我使用上述方法的重载版本时:

然后一切正常 - 我得到了一个正确的 DOM 树,但我需要以某种方式从服务器检索 POST 答案。

将字符串存储在文件中并将其读回不起作用 - 仍然得到相同的结果。

可能是什么问题呢?

0 投票
1 回答
1986 浏览

java - XPath 表达式对 //element 不返回任何内容,但 //* 返回一个计数

我将 XOM 与以下示例数据一起使用:

以下元素返回许多元素(来自真实数据):

但类似的东西

什么都不返回。如果我遍历根的孩子,数字似乎匹配,如果我打印元素名称,一切似乎都正确。

我正在获取 HTML,用 tagoup 解析它,然后从生成的字符串构建一个 XOM 文档。这其中的哪一部分会出现如此可怕的错误?我觉得这里发生了一些奇怪的编码问题,但我只是没有看到。Java 字符串是字符串,对吧?

0 投票
1 回答
1229 浏览

java - JDOM 1.1:连字符不是有效的注释字符

我正在使用 tagoup 清理我从互联网上抓取的一些 HTML,并且在解析带有注释的页面时出现以下错误:

我正在使用 JDOM 1.1,这是进行实际清理的代码:

知道出了什么问题,或者如何解决这个问题?我需要能够解析具有长注释字符串的页面<!--------- data ------------>

0 投票
1 回答
1065 浏览

java - 使用 TagSoup 解析 XML:具有长属性的错误?

我正在尝试使用 TagSoup 解析丑陋的 HTML 以提取给定标签的值。这是标签:

我想检索属性“value”的值(“ffc39410ed8da309408a9382450ddc85”)

这是我的代码,在我的 SAX 处理程序中:

日志用于调试目的。Logcat 正确地为 atts.getValue("name") 提供了“hash_check”,但为 atts.getValue("value") 提供了一个空字符串,尽管解析器位于正确的“输入”(我的 html 文档中唯一的一个) )。

怎么了 ?TagSoup 中的错误?

谢谢

编辑@bkail:感谢您的评论。这里有更多细节和代码。

首先,我要解析的 URL:http: //forum.hardware.fr/hfr/Programmation/Divers-6/experts-puissant-internet-sujet_37483_1.htm

以及用于实例化解析器的代码:

最后,我的 SAX 解析器的全部代码:

感谢您试一试。

0 投票
1 回答
4601 浏览

java - jTidy 和 TagSoup 文档

我正在寻找 TagSoup 和 jTidy 库的文档(如果可能的话,官方文档)。

我想使用这个库来操作 html“tagsoup”文件,这些文件包括 xml 标记,其中不同的命名空间混合在 html(html、xhtml 或 html5)标记之间。

我已经测试过 HTMLCleaner、NekoHTML 和 Jericho,但除了清除文件的最简单示例之外,我没有找到 jTidy 和 TagSoup 的文档。

我需要有关操作内容、替换标签、提取信息等的文档...

谢谢

注意:测试所有选项后,我使用了StAX / Woodstox

0 投票
3 回答
783 浏览

xml - tagoup 和 Groovy 的 XmlSlurper 的奇怪行为

假设我想从这样的 xml 字符串中解析电话号码:

它不打印电话号码。

如果我像这样将“div”元素更改为“foo”

然后它能够​​解析和打印电话号码。

到底他妈发生了什么?

顺便说一句,我正在使用 groovy 1.7.5 和 tagoup 1.2

0 投票
1 回答
342 浏览

java - 使用 SAX 解析 XHTML 以仅更改 PCDATA

我正在寻找一个使用 Sax 解析器来解析 XHTML 字符串并将字符串 (s1) 的每一次出现都更改为 (s2) 的示例,如果 s1 在 PCDATA 而不是属性中。有人可以在这里点亮一些灯吗......

谢谢!

0 投票
1 回答
2108 浏览

java - TagSoup 和 XPath

我正在尝试将 TagSoup 与 XPath (JAXP) 一起使用。我知道如何从 TagSoup(或 XMLReader)获取 SAX 解析器。但是我找不到如何创建将使用该 SAX 解析器的 DocumentBuilder。我怎么做?

谢谢你。

编辑:抱歉这么笼统,但 Java XML API 实在是太痛苦了。

编辑2:

问题解决了:

编辑3:

帮助我的链接:http: //www.jezuk.co.uk/cgi-bin/view/jez?id=2643

0 投票
5 回答
6430 浏览

java - 如何从 XMLReader 获取属性

我有一些要转换为Spannedusing的 HTML Html.fromHtml(...),并且我有一个正在使用的自定义标签:

所以我实现了一个TagHandler来处理这个自定义标签,如下所示:

在这种情况下,我得到一个 SAX 异常,因为我相信“id”字段实际上是一个属性,而不是一个属性。但是,没有getAttribute()方法XMLReader。所以我的问题是,如何使用 this 获取“id”字段的值XMLReader?谢谢。