问题标签 [hpricot]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
212 浏览

ruby - 如何将文本添加到 Hpricot 中的空元素?

如果我有一个空标签:

如何添加文本以便最终得到:

我似乎只能用不同的内容交换整个标签或在它之前/之后添加内容。

0 投票
1 回答
657 浏览

ruby-on-rails - hpricot 在尝试解析具有 noscript 标签的 url 时抛出异常

我在 ruby​​ on rails 中使用 hpricot gem 来解析网页并提取元标记内容。但是如果网站在<noscrpit>标签之后有一个标签,<head>它会抛出异常

我什至尝试将 gem 更新到最新版本。但还是一样。

这是我使用的示例代码。

在将网页提供给 hpricot 之前,我正在考虑删除 noscript 标签。还是有其他方法可以做到这一点?

我的 html 片段

0 投票
1 回答
663 浏览

nokogiri - 如何将此 hpricot 代码翻译为 nokogiri?

在http://www.savedmyday.com/2008/04/25/how-to-extract-text-from-html-using-rubyhpricot/上找到它

0 投票
1 回答
867 浏览

css - CSS 选择器排除元素,hpricot

我正在尝试编写一个 CSS 选择器,它使用 hpricot 选择除脚本元素之外的所有内容,我可以轻松选择 select-me div 的所有内容,然后删除脚本元素,但我想知道是否可以使用选择器将排除脚本元素:

所以最后我回来了:

干杯

0 投票
1 回答
317 浏览

java - hpricot使用java?

我刚刚注意到很多 hpricot 代码是用 java 编写的......

替代文字 http://img697.imageshack.us/img697/7447/picture2yw.png

听说在处理正则表达式时,JRuby 的表现比原生 ruby​​ 好很多。如果安装了 JRuby 或 Java,可能只是激活了 java 类,如果没有找到这些,则使用 ruby​​?

这确实是一件令人费解的事情。

谢谢

0 投票
2 回答
328 浏览

ruby-on-rails - 如何让 Hpricot 与 HTML5 搭配得很好?

我正在使用 Hpricot 来解析主题文件。但是,我注意到,如果我将有效的 HTML5 文档输入 Hpricot(),它会自动关闭 HTML5 标记(如<section>),并与DOCTYPE.

是否有任何 Hpricot 扩展,或者我需要设置的标志,以允许正确解析 HTML5 文档?

0 投票
3 回答
7383 浏览

ruby - Nokogiri vs Hpricot?

你会选哪一个?我的重要属性是(不按顺序):

  1. 支持和未来的增强。
  2. 社区和一般知识库(在 Internet 上)。
  3. 全面的(IE,证明可以解析广泛的 *.*ml 页面)。
  4. 表现。
  5. 内存占用(运行时,而不是代码库)。
0 投票
2 回答
320 浏览

ruby - Ruby - 将 Hpricot 数据写入文件

我目前正在做一些 XML 解析,我选择使用 Hpricot 是因为它易于使用和语法,但是我遇到了一些问题。我需要将我发现的一段 XML 数据写入另一个文件。但是,当我这样做时,格式不会被保留。例如,如果内容应如下所示:

并假设文档中有很多这样的条目。我正在通过使用迭代“dict”项目


使用上面的代码后,我希望输出如下所示,与上面显示的 XML 完全相同。然而令我惊讶的是,文件的输出看起来更像这样:


我尝试在“\n”字符处拆分并一次写入文件一行,但这似乎也不起作用,因为它无法识别“\n”字符。任何帮助是极大的赞赏。这可能是一个非常简单的解决方案,但我很难找到它。谢谢!

0 投票
3 回答
660 浏览

ruby-on-rails - 使用 hpricot删除标签

像这样的html:

我想替换字体标签的结果是这样的:

感谢您

0 投票
1 回答
814 浏览

html - 如何使用 Hpricot 删除 html 元素的样式属性?

像这样:

我想删除每个元素的“样式”属性。我想要这样的结果:

如何使用 hpricot 做到这一点?

谢谢。


好的,我已经解决了这个问题,如下所示: