问题标签 [hpricot]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
122 浏览

css - Ruby:网页的计算样式

我正在使用 Hpricot 解析 html 页面,但需要获取每个元素的计算样式。例如,如果我有一个 h1 Hpricot 元素,并且页面的外部 CSS 有一个为 h1 定义的背景图像,我如何找出背景图像是什么?

0 投票
1 回答
338 浏览

ruby - 使用 Hpricot 抓取具有异步响应的页面

我正在尝试抓取一个页面,但初始响应在正文中没有任何内容,因为内容是异步输入的,例如苹果网站上的搜索结果:http: //www.apple.com/uk/search/ ?q=搜索+for+something&sec=global

关于如何使用 hpricot 成功获取搜索结果的任何想法?

谢谢。

0 投票
3 回答
2804 浏览

xpath - 在 Xpath 搜索中转义冒号

我正在使用带硒的 Hpricot 我有这个 html 输入元素:

我试图用这个 Xpath 表达式来获得这个值:

但由于冒号,它没有找到任何东西。我已经看到 Xpath 表达式不能包含任何冒号。我试图以不同的方式逃避它,但它不起作用。

有什么办法可以逃避或避免这个问题?我无法更改 html 中的值,因此 foo:bar 必须是这种方式,带有冒号。但我需要以某种方式找到这个元素。

有任何想法吗?

谢谢

0 投票
2 回答
946 浏览

ruby - hpricot 的编码问题

尝试在 ruby​​ 1.9 中使用 hpricot 抓取网页时出现以下编码错误:

我可以通过执行以下操作来重现错误:

0 投票
1 回答
622 浏览

ruby - 如何用红宝石字符串替换节点?

我正在尝试用rails 标签替换<img>HTML 文件中的所有标签。<%= image_tag() %>

我想做的是:

我需要一个函数,它将文件中的节点替换为我将传递的字符串。

更新:

我真的不想使用正则表达式,这就是我选择 Hpricot 的原因,因为它会为我解析 HTML,然后我可以做Element.attributes并生成image_tag包含所有属性的我。

如果我的 img 标签是这样的:

或者

明白了吗?我可能会解析一个包含转义斜杠的 .SQL 文件,该src属性可能在另一个属性之后,等等...

image_tag问题是我已经完成了如果我给出 an将返回我的函数Hpricot::Element,但我不知道如何在 Hpricot 文档中用我的字符串替换原始节点。

0 投票
1 回答
134 浏览

html - 使用 Hpricot 删除元素的类属性

我该怎么做?例如,

应该成为

0 投票
1 回答
115 浏览

ruby-on-rails - 用 hpricot 解析问题

我有一个如下所示的 XML:

使用 hpricot 提取“ http://www.someweb.com/something.png ”的正确方法是什么?我能得到的最接近的是这个......

我已经阅读了 github 上的 hpricot README 并用谷歌搜索,但还没有找到任何东西。提前感谢您的任何答案!

0 投票
2 回答
527 浏览

ruby - 我可以使用 Hpricot 查找任何/大多数网站的主要文章文本吗?

我需要一种从任何显示文章的网页中提取正文的方法。类似于Readability可以在其运行的任何网站上找到主要文本的方式。

我正在使用 Ruby on Rails,所以我认为 Hpricot 是我最好的选择。我在 Hpricot 寻找的可能吗?某处有例子吗?谢谢阅读。


0 投票
3 回答
983 浏览

tags - 通过 Hpricot 从页面中获取最大的图像

我试图从我用 Hpricot 解析的页面中获取最大的图像,但没有任何运气。如何使用它访问 img 标签的宽度和高度属性?

0 投票
3 回答
962 浏览

javascript - Ruby Hpricot RegEx 将
's替换为

有人可以告诉我如何使用 Hpricot 和 RegEx 将这行 Javascript 转换为 Ruby 吗?

我设置的代码是:

谢谢