问题标签 [html-parser]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
2485 浏览

css - 在 Ruby 中将外部 CSS 转换为内联 CSS 的工具?

我在搞乱 GoogleDocs,它有非常原始的 CSS 支持。如果您上传 MSWord .doc 或 HTML 文件并将其导出为 HTML,则所有样式都会内联应用。它们在 html 文件中有一个样式块,但是当您将 HTML 文件上传回谷歌文档时,它不会应用任何非内联样式。

所以我在想“也许有一个红宝石工具”。有什么我可以用来获取一些 CSS 并将其解析为 HTML 节点的东西,也许是一些 nokogiri 插件?

0 投票
2 回答
2312 浏览

perl - 如何在 Perl 5.6 上安装 HTML-Parser-3.64?

我正在尝试安装 HTML-Parser-3.64 并在运行时收到以下报告make test

我有 Perl 版本 5.6.1。和 Solaris 8 上 Parser 的 3.64 版本。我在http://www.cpantesters.org/cpan/report/6653478上看到了另一个人在互联网上报告的类似错误。但看不到任何回复或解决方案。

0 投票
4 回答
33264 浏览

ruby - 在 Ruby 中解析 HTML 文档的方法?

像 PHP 中的 DOMDocument 类一样,RUBY 中是否有任何类(即核心 RUBY)来解析和获取 HTML 文档中的节点元素值。

0 投票
1 回答
3110 浏览

iphone - 类似 C/Objective-c/iPhone 的“html 敏捷包”解决方案

我需要一个功能强大的用于 Objective-C/C 的 HTML 解析器和操纵器,比如 HTML Agility Pack。

谁能告诉我一些最佳解决方案?一种解决方案是 libxml2,但它的接缝并不是最好的。

提前致谢!

0 投票
1 回答
312 浏览

java - 如何解析html

我已经下载了 Java HtmlParser,但我不知道如何使用 API 来提取 HTML 数据。你能举一些例子,以便我可以研究它吗?

0 投票
1 回答
7190 浏览

perl - 用自定义标签(Perl 解释器)解析 HTML 文档的简单 Perl 脚本是什么?

好的,这就是我正在做的。我正在为以我的自定义扩展名(.cpm)结尾的文档制作 perl 解释器。我环顾四周,发现

似乎HTML::Parser是要走的路。我要的是一个简单的教程来解析带有特殊标签的文档。例如,我想要一些向我展示如何解析 HTML 文档的东西,但每当<putinbold>遇到它时,它都会将其替换为<b>.

我想要的一个例子-

<html>
This is HTML talking
<liamslanguage>say "This is Liams language speaking"</liamslanguage>
</html>

0 投票
2 回答
1111 浏览

java - html 搜索和替换保留的 html 标签

我正在寻找一个基于 Java 的 html 解析器,它可以搜索和替换保留 html 标签的文本。这个问题以前在这里被问过,但答案似乎没有达到目标。我下载并编写了一些简单的程序来查看它们是否可以完成这项工作的 html 解析器很少。这些包括 jsoup、Jericho、Java HTML 解析器等。这些可以进行搜索,但是在替换保留 html 标记的文本时,没有办法做到这一点。

我已经阅读了这些帖子的完整主题:

如何在保留html标签/结构的同时查找/替换html中的文本

html在服务器端搜索和替换

如果今天不存在这样的解析器,那么实现它的最佳方法是什么?如果您已经做过类似的事情,您可以分享代码吗?

0 投票
2 回答
846 浏览

c# - HTML Parser 验证标签

我需要 html 解析,它能够识别生成的 html 中的错误,如果标签未关闭,则关闭它并返回有效的 html。

更多详细信息:我正在从数据库中获取数据并打破该记录以在我的网站上显示部分详细信息以单击更多按钮然后显示完整内容。断开字符串后验证。

我已经使用过 Html Agility Pack,但我是新手,如果这个库解决了我的问题,那么指导我如何(教程)或建议我另一个库。

0 投票
2 回答
95 浏览

xml - 请帮我解决xpath

可能重复:
如果您知道 xpath,请帮忙?

你好,这里是html代码

所以现在我想要文本谷歌和雅虎!

我怎么能得到那个

这是我写的

我不知道发生了什么,但什么都没有出现......

谢谢

0 投票
1 回答
622 浏览

java - 我正在使用 org.htmlparser.Parser 解析 URL,但它对外部 URLS 失败并给出 Connection Refused: connect 错误

我正在使用 org.htmlparser.Parser 解析 URL,它适用于网络中的所有内部 URL。但是当我尝试打开外部 URL 时,它给出了

线程“主”org.htmlparser.util.ParserException 中的异常:连接被拒绝:连接;java.net.ConnectException:连接被拒绝:连接

这条线失败了-

解析器 p = new Parser("http://www.google.com");

我可以使用代理在浏览器中打开外部 URL。所以我也在代码中使用 Authenticator 类进行代理身份验证,但它不起作用。