问题标签 [hpricot]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
3271 浏览

ruby - 在哪里可以找到 Hpricot 文档?

现在http://github.com/why/hpricot/wikis/home不再存在。

0 投票
2 回答
783 浏览

ruby-on-rails - Rails 控制器中的 Hpricot 超时错误

嘿——我正在编写一个使用 digg API 的基本 Rails 应用程序。我正在尝试使用 hpricot 解析 digg 的 api 提供的 xml 数据,但是在测试页面时,浏览器会挂起,直到我最终捕获 Timeout::Error 异常。

这是控制器的代码:

这是堆栈跟踪:

我只是在学习 Rails,我不知道发生了什么。关于为什么会发生这种情况的任何想法?

更新

我使用本地保存的 xml 文件尝试了相同的确切过程,并且效果很好——问题可能与 open-uri 和远程 xml 有关

0 投票
1 回答
1517 浏览

xml - 使用 JRuby (Hpricot?) 解析 XML,并带有类似的标签

我正在尝试在 JRuby 中使用一些带有类似元素的遗留 XML:

我一直在使用 Hpricot,但是 Hpricot 的面向 HTML 的快捷方式对我不利:doc.search("//with.dot")似乎正在寻找<with class="dot" />

(几年前,我也遇到了 JQuery 的这个问题。)

我可以用 Hpricot 做到这一点,还是需要使用不同的库?

0 投票
3 回答
1332 浏览

ruby - 在 hpricot/nokogiri 中搜索 h2 元素之前的所有元素

我正在尝试解析一个维基词典条目以检索所有英文定义。我能够检索所有定义,问题是某些定义是其他语言的。我想做的是以某种方式只检索带有英文定义的 HTML 块。我发现,在有其他语言条目的情况下,可以通过以下方式检索英文定义之后的标题:

所以我只想搜索这个标题元素之前的所有元素。我认为这可能是可能的header.preceding_siblings(),但这似乎不起作用。有什么建议么?

0 投票
4 回答
10298 浏览

html - 使用 Ruby 从 HTML 文档中剥离文本

有很多例子说明如何使用 Ruby 从文档中去除 HTML 标签,Hpricot 和 Nokogiri 有 inner_text 方法,可以轻松快速地删除所有 HTML。

我想做的是相反的,从 HTML 文档中删除所有文本,只留下标签及其属性。

我考虑循环将文档设置 inner_html 设置为 nil 但实际上你必须反向执行此操作,因为第一个元素(根)具有整个文档其余部分的 inner_html,所以理想情况下我必须从最里面的元素,并将 inner_html 设置为 nil,同时向上移动通过祖先。

有谁知道有效地做到这一点的巧妙小技巧?我在想也许正则表达式可能会这样做,但可能不如 HTML 标记器/解析器那样有效。

0 投票
2 回答
651 浏览

xml - 是否可以使用 Hpricot 创建 XML 文件?

我知道我可以使用 Hpricot 解析 XML,但是也可以创建文件吗?我发现的所有教程都只演示了解析。

0 投票
3 回答
8429 浏览

java - org.jruby.Main 上的 NoClassDefFoundError

我正在尝试使用 JRuby 1.4.0RC1 在我的 Windows 机器上安装 hpricot gem。我正在尝试遵循相关问题的建议(请参阅 ->为 JRuby 安装 hpricot)。

根据答案的建议,我拉出了 hpricot 的 git 头并从它的目录中运行:

但是当我运行它时,我得到以下 NoClassDefFoundError:

显然我的 JRUBY_HOME\lib\jruby.jar 迷路了。

运行 jruby -v 工作正常,所以我很困惑我的类路径在哪里搞砸了。

0 投票
4 回答
14694 浏览

ruby - 如何在 Nokogiri 中对匹配某个开头的文本进行正则表达式搜索?

鉴于:

我想做一些我可以在 Hpricot 做的事情:

  1. 如何对 XPath 样式的元素进行模式搜索?
  2. 我在哪里可以找到帮助我的文档?我在 rdocs 中没有看到这个。
0 投票
2 回答
1999 浏览

ruby-on-rails - 为什么 Twitter API 在生产中返回 400 错误?

我有一个 Twitter 应用程序,在本地工作得很好——它搜索关键字,然后为每个用户获取他们的信息,使用 Hpricot 来解析 xml,例如

Hpricot(open("http://twitter.com/users/show/"+myuser+".xml"))

在本地工作正常,但当我爱上它时它失败了。查看我的日志,我收到此错误:

OpenURI::HTTPError (400 Bad Request):

奇怪的是,有时它会起作用。

这几天来一直是一个反复出现的问题,让我发疯。会拥抱任何有解决方案的人:)

0 投票
2 回答
1991 浏览

xml - 用 hpricot 解析 XML,获取属性

我的xml:

http://www.google.ru/ig/api?weather=车里雅宾斯克

例如如何获取城市数据?不是inner_html,只是城市数据、邮政编码等属性。