问题标签 [hpricot]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
537 浏览

html - hpricot add attribute to a HTML tag?

Can someone please explain how to add a custom attribute to an HTML tag using Ruby with Hpricot gem?

I have a tag that looks like this:

and I want to add a custom integer attribute called 'Readable=0' so it looks like this:

Is this possible?

0 投票
3 回答
1783 浏览

ruby - 如何使用 Hpricot 从 XML 中的文本周围删除标签?

我只是想要没有那些标签的文本。Hrpicot.XML 有什么方法吗?

0 投票
1 回答
161 浏览

ruby-on-rails - Hpricot 和 Rails

我对 Ruby 和 Rails 完全陌生……事实上,我今天在 Rails 中创建了我的第一个应用程序,它发出一个 HTTP 请求来拉回 XML 文档,然后将其输出到屏幕上……很容易上手……

好吧,我现在需要解析 XML 字符串,但我不知道如何用 Hpricot 准确地做到这一点。

到目前为止,这是我的代码

控制器

模型

我如何将信息传递到我的视图中?

0 投票
1 回答
128 浏览

ruby-on-rails - 在 XML 节点中搜索 Ruby 和 Hpricot 中的元素

我正在尝试编写一个 Rails 应用程序,它接受一个 XML 对象,然后迭代该对象,向用户显示不同节点内包含的信息。

我对 Rails 完全陌生,来自 PHP 背景,并且在使用特定功能时遇到了一些问题。

我基本上需要说,如果这个节点存在就死掉,如果它不继续代码。现在我知道如何在 PHP 中做到这一点,但对于我的生活,我无法在 Ruby 中使用 Hpricot 来解决这个问题。

控制器:

知道我做错了什么吗?

0 投票
3 回答
900 浏览

javascript - 任何 Ruby 的 HTML 解析器都可以执行 JavaScript 来查看生成的 DOM 吗?

在尝试 Hpricot 和 Nokogiri 时,可以获取和解析 HTML,但它们是否也可以执行 Javascript 以便内容显示在页面上?(显示在 DOM 中)。这是因为除非 JavaScript 初始化代码已经运行,否则某些页面不会显示信息。

0 投票
2 回答
934 浏览

ruby - XML 到 Ruby 中的哈希表:解析历史发明列表

我想将以下有关历史发明的数据收集到一个方便的 Ruby 数据结构中:

http://yootles.com/outbox/inventions.xml

请注意,所有数据都在 XML 属性中。

似乎应该有几行代码的快速解决方案。使用 Rails 会有 Hash.from_xml 虽然我不确定它会正确处理属性。无论如何,我需要它作为一个独立的 Ruby 脚本。 根据有人发布的类似问题的代码,对于这个简单的任务, Nokogiri似乎过于复杂:http: //gist.github.com/335286。我找到了一个使用 hpricot 的据称简单的解决方案,但它似乎无法处理 XML 属性。也许这是一个简单的扩展?最后是ROXML,但它看起来比 nokogiri 更重量级。

为了使问题具体化(并且具有明显的别有用心),假设答案应该是一个完整的 Ruby 脚本,它从上述 URL 中读取 XML 并像这样吐出 CSV:

我会自己解决并发布它,除非有人用明显优越的东西击败我。谢谢!

0 投票
1 回答
302 浏览

html - 使用 Hpricot 和 Ruby 解析 HTML - 获取最里面的 html?

我正在寻找解析一些旧的 html,这些旧的 html 有很多现在可以用 CSS 完成的无关标签 - <b>,<font>等。我正在使用 Hpricot 来解析它,但我想得到最里面的“inner_html” - 怎么做用 Hpricot 做那个?例如,假设我使用 Hpricot 抓取<table>我循环通过的所有元素以获取行和单元格,但我想获取单元格内的数据,但它们不能有额外的标签或类似的东西<b><font ...>1,000</font></b>- 有没有技巧只拿出“1,000”?

谢谢,

0 投票
1 回答
263 浏览

html - RoR:将 HTML 存储在文件中以备后用

在我们的应用程序中,我们有不同的主题,每个主题都有自己的默认内容,结构如下:

可能有多个行、列和内容元素。我们需要将这些数据(手动)存储在一个文件中,然后将其读取并转储到数据库中。我们尝试使用 XML,但即使使用 CDATA 似乎也不可行。

我们还有其他选择:

一种。存储在简单的 HTML 文档中并使用 Hpricot 进行检索

湾。在检索时使用 YAML 进行存储

请让我知道哪种方式更好或任何其他更好的选择。

谢谢,

伊姆兰

0 投票
2 回答
648 浏览

ruby - HPricot css search:如何使用字符串选择器选择特定元素的父/祖先?

我正在使用 HPricot 的 css 搜索来识别网页中的表格。这是我正在解析的示例 html 片段:

页面中有很多表格。我想找到包含A Name=a1参考的表。现在,我这样做的方式是

我不喜欢这个,因为

  • 很丑
  • 它容易出错(如果维护网页的人删除了 tbody 怎么办?)

有没有办法告诉 hpricot 让我得到指定元素的表祖先?

编辑:这是我正在解析的完整页面:http: //www.blonnet.com/businessline/scoboard/a.htm

我感兴趣的是两张表,一张是季度业绩,另一张是年度业绩。现在,我提取这些表的方法是查找并从那里向上移动。

0 投票
1 回答
473 浏览

ruby - 在 Ruby 1.9.2 中安装 hpricot 有困难

我正在使用 Ruby 1.9.2,并且我有一个使用 hpricot 的任务。我尝试安装 hpricot gem,但收到错误消息。extconf.rb 失败。无法创建生成文件。检查 mkmf.log。但我找不到 mkmf.log。

我检查了其他答案并尝试使用 gem install hpricot-platform=mswin32 进行安装。那也没有用。

我应该重新安装 Ruby 1.8 版吗?