“tag-soup”的相关标签问题_Stack Overflow中文网

0 投票

3 回答

198 浏览

asp.net - 有哪些选项可以确定我的 ASP.NET MVC 视图是否不兼容 XHTML

澄清：感谢验证 XHTML 的工具的建议。我主要是在寻找一个可以在服务器端（或在客户端使用 jQuery）运行的解决方案，这样我就可以在开发过程中设置它并忘记它——当我遇到问题时被告知，而不必一直运行工具。

所有这些标签汤的东西都让我害怕 ASP.NET MVC ！

如果我可以验证来自我的视图生成器的每个视图是否符合 XHTML，我就不会那么害怕了。这对于我计划编写的大量 jQuery 尤其重要。我不想花几个小时调试某些东西，只是为了发现我在某处有一个未关闭的标签，它阻止了选择器的工作。

有什么选择。在我的脑海中，我正在寻找类似以下的解决方案，但不确定其中哪些是实用的：

JQuery XHTML 检查器
IIS 过滤器
浏览器插件（我假设 Firebug 插件可以做到这一点）
用 MVC 视图类做一些聪明的事情（我不确定这是否可能或值得说服）。
修改 HTML 编写器以检查“flush()”并在输出不是 XHTML 时抛出异常。
我不知道要验证页面的 ASP.NET 配置选项。

所有选项欢迎回答！

我更喜欢服务器端技术，因此在调试期间我可以抛出一个硬异常，并且在生产中我可以记录任何错误。它必须在应用母版页后验证整个页面。在 IDE 中寻找警告并不是一个足够好的解决方案！

Simon

2009-01-27T09:37:26.040

0 投票

3 回答

2229 浏览

java - Tagsoup 无法从 StringReader (java) 解析 html 文档

我有这个功能：

它需要一个字符串，其中包含 HTTP 服务器在 POST 请求后发送的 html 文档，但无法正确解析它 - 我只从整个文档中获得了四个节点。字符串本身看起来不错 - 如果我将其打印出来并将其复制到文本文档中，我会看到我期望的页面。

当我使用上述方法的重载版本时：

然后一切正常 - 我得到了一个正确的 DOM 树，但我需要以某种方式从服务器检索 POST 答案。

将字符串存储在文件中并将其读回不起作用 - 仍然得到相同的结果。

可能是什么问题呢？

java string tag-soup stringreader

2010-02-21T00:07:46.603

0 投票

1 回答

1986 浏览

java - XPath 表达式对 //element 不返回任何内容，但 //* 返回一个计数

我将 XOM 与以下示例数据一起使用：

以下元素返回许多元素（来自真实数据）：

但类似的东西

什么都不返回。如果我遍历根的孩子，数字似乎匹配，如果我打印元素名称，一切似乎都正确。

我正在获取 HTML，用 tagoup 解析它，然后从生成的字符串构建一个 XOM 文档。这其中的哪一部分会出现如此可怕的错误？我觉得这里发生了一些奇怪的编码问题，但我只是没有看到。Java 字符串是字符串，对吧？

java xpath xml-namespaces xom tag-soup

2010-02-24T01:56:13.407

0 投票

1 回答

1229 浏览

java - JDOM 1.1：连字符不是有效的注释字符

我正在使用 tagoup 清理我从互联网上抓取的一些 HTML，并且在解析带有注释的页面时出现以下错误：

我正在使用 JDOM 1.1，这是进行实际清理的代码：

知道出了什么问题，或者如何解决这个问题？我需要能够解析具有长注释字符串的页面

java web-crawler jdom tag-soup

2010-04-11T17:14:24.137

0 投票

1 回答

1065 浏览

java - 使用 TagSoup 解析 XML：具有长属性的错误？

我正在尝试使用 TagSoup 解析丑陋的 HTML 以提取给定标签的值。这是标签：

我想检索属性“value”的值（“ffc39410ed8da309408a9382450ddc85”）

这是我的代码，在我的 SAX 处理程序中：

日志用于调试目的。Logcat 正确地为 atts.getValue("name") 提供了“hash_check”，但为 atts.getValue("value") 提供了一个空字符串，尽管解析器位于正确的“输入”（我的 html 文档中唯一的一个））。

怎么了？TagSoup 中的错误？

谢谢

编辑@bkail：感谢您的评论。这里有更多细节和代码。

首先，我要解析的 URL：http: //forum.hardware.fr/hfr/Programmation/Divers-6/experts-puissant-internet-sujet_37483_1.htm

以及用于实例化解析器的代码：

最后，我的 SAX 解析器的全部代码：

感谢您试一试。

java android tag-soup

2010-08-29T13:17:12.053

0 投票

1 回答

4601 浏览

java - jTidy 和 TagSoup 文档

我正在寻找 TagSoup 和 jTidy 库的文档（如果可能的话，官方文档）。

我想使用这个库来操作 html“tagsoup”文件，这些文件包括 xml 标记，其中不同的命名空间混合在 html（html、xhtml 或 html5）标记之间。

我已经测试过 HTMLCleaner、NekoHTML 和 Jericho，但除了清除文件的最简单示例之外，我没有找到 jTidy 和 TagSoup 的文档。

我需要有关操作内容、替换标签、提取信息等的文档...

谢谢

注意：测试所有选项后，我使用了StAX / Woodstox：

java jtidy tag-soup jericho-html-parser

2010-12-15T16:49:58.373

0 投票

3 回答

783 浏览

xml - tagoup 和 Groovy 的 XmlSlurper 的奇怪行为

假设我想从这样的 xml 字符串中解析电话号码：

它不打印电话号码。

如果我像这样将“div”元素更改为“foo”

然后它能够解析和打印电话号码。

到底他妈发生了什么？

顺便说一句，我正在使用 groovy 1.7.5 和 tagoup 1.2

xml parsing groovy tag-soup

user308808

2011-01-27T02:44:42.810

0 投票

1 回答

342 浏览

java - 使用 SAX 解析 XHTML 以仅更改 PCDATA

我正在寻找一个使用 Sax 解析器来解析 XHTML 字符串并将字符串 (s1) 的每一次出现都更改为 (s2) 的示例，如果 s1 在 PCDATA 而不是属性中。有人可以在这里点亮一些灯吗......

谢谢！

java parsing xhtml sax tag-soup

2011-04-15T06:05:57.070

0 投票

1 回答

2108 浏览

java - TagSoup 和 XPath

我正在尝试将 TagSoup 与 XPath (JAXP) 一起使用。我知道如何从 TagSoup（或 XMLReader）获取 SAX 解析器。但是我找不到如何创建将使用该 SAX 解析器的 DocumentBuilder。我怎么做？

谢谢你。

编辑：抱歉这么笼统，但 Java XML API 实在是太痛苦了。

编辑2：

问题解决了：

编辑3：

帮助我的链接：http: //www.jezuk.co.uk/cgi-bin/view/jez?id=2643

java xpath tag-soup

2011-07-21T21:46:13.907

0 投票

5 回答

6430 浏览

java - 如何从 XMLReader 获取属性

我有一些要转换为Spannedusing的 HTML Html.fromHtml(...)，并且我有一个正在使用的自定义标签：

所以我实现了一个TagHandler来处理这个自定义标签，如下所示：

在这种情况下，我得到一个 SAX 异常，因为我相信“id”字段实际上是一个属性，而不是一个属性。但是，没有getAttribute()方法XMLReader。所以我的问题是，如何使用 this 获取“id”字段的值XMLReader？谢谢。

java android xmlreader tag-soup

2011-08-05T06:22:25.387

问题标签 [tag-soup]

Reference