1

我正在寻找一个 QT HTML 解析器工具。我有一些 html 源代码,我想在上面使用 XQuery。我已经尝试过使用 QWebPage + QWebElement,但我不喜欢这个解决方案,因为首先它不适用于非 gui 线程(因为 QWebPage),并且因为我们不能应用 XPath 而应用 CSS Path。我尝试的另一个解决方案是 QXmlQuery,它工作得很好,但唯一的问题是如果页面上有错误,它就不起作用。例如,我尝试的第一个页面缺少 systemId(在 DOCTYPE 标记中),因此解析被中止。

我听说我们可以使用 gecko 进行解析,但我不知道如何将它与 QT 一起使用。

你有什么建议吗?

谢谢

4

2 回答 2

1

我建议您在 HTML 页面上使用 tidy,然后使用 XQuery 处理它。

Zorba 是一个提供整洁模块的 C++ XQuery 处理器。您可以在http://www.zorba-xquery.com/html/demo#tQZu6aq1K4KoGJm9m0oIPwKRt04=找到一个实时示例

于 2012-07-09T05:18:08.877 回答
1

BaseX 有一个QT 客户端,可以使用TagSoup来清理 HTML 文档。

很抱歉,我无法为您提供 QT 示例,因为我根本不了解 QT。

于 2012-07-09T06:45:19.030 回答