问题标签 [hpricot]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1949 浏览

ruby-on-rails - XML => 带有 Hpricot 和 Rails 的 HTML

我从未使用过 Web 服务和 Rails,显然这是我需要学习的东西。我选择使用 hpricot 因为它看起来很棒。无论如何,_why 已经很好地在hpricot 网站上提供了以下示例:

看起来简单、优雅、轻松。在 Ruby 中效果很好,但我的问题是:如何在 Rails 中分解它?

我尝试将这一切添加到单个控制器中,但想不出在视图中调用它的最佳方法。

因此,如果您从 Web API 解析 XML 文件并使用 Hpricot 将其打印为干净的 HTML,您将如何分解模型、视图和控制器上的活动,以及将什么放在哪里?

0 投票
1 回答
366 浏览

ruby-on-rails - 如何获得基于 FreeBSD 构建的 Hpricot 0.6 Gem?

当我在我的 FreeBSD 服务器上运行 rake gems:build with hpricot 0.6.164 时,我得到:

错误:无法构建 gem 原生扩展。

/user/localbin/ruby18 extconf.rb gems:build RB_USER_INSTALL 检查 -lc 中的 main() ...是创建 Makefile

制作

make install /usr/bin/install -c -o root -g wheel -m 0755 hpricot_scan.so /user_directory/vendor/gems/hpricot-0.6.164/lib/universal-java1.6 安装:/user_directory/vendor/gems /hpricot-0.6.164/lib/universal-java1.6/hpricot_scan.so: chown/chgrp: 不允许操作 *** 错误代码 71

在 /user_directory/vendor/gems/hpricot-0.6.164/ext/hpricot_scan 中停止。

0 投票
2 回答
7476 浏览

ruby - 使用 Hpricot (Ruby) 解析 HTML 表格

我正在尝试使用 Hpricot 解析 HTML 表格,但被卡住了,无法从具有指定 ID 的页面中选择表格元素。

这是我的红宝石代码:-

谁能帮我确定这有什么问题。

0 投票
5 回答
2160 浏览

python - 正在寻找关于网络抓取项目最佳实践的优秀教程的推荐?

我需要做一个涉及网络抓取的相当广泛的项目,并且正在考虑使用 Hpricot 或 Beautiful Soup(即 Ruby 或 Python)。有没有人遇到过他们认为在这个主题上特别好的教程,可以帮助我正确地开始这个项目?

0 投票
4 回答
2467 浏览

ruby-on-rails - 为 JRuby 安装 hpricot

我正在尝试查看 Jruby on Rails 的黄瓜。其中一个先决条件是 webrat,它具有先决条件 hpricot。

我已经使用 hpricot 安装了 gem:

gem install hpricot --source http://code.whytheluckystiff.net --version 0.6.1 --platform java

这将安装 hpricot 的 java 版本。我将 hpricot_scan.jar 添加到 CLASSPATH 但是当我运行时:

我得到以下输出:

等等

如果我编译 HpricotScanService.java 文件并将生成的 .class 文件添加到类路径中,我会得到:

如果我尝试安装更高版本的 hpricot,那么我会得到:

有没有人知道我做错了什么/没有做什么/我在哪里愚蠢。?

使用 Windows XP、JRuby 1.2.0

0 投票
5 回答
2063 浏览

ruby - hpricot with firebug's XPath

I'm trying to extract some info from a table based website with hpricot. I get the XPath with FireBug.

This doesn't work... Apparently, the FireBug's XPath, is the path of the rendered HTML, and no the actual HTML from the site. I read that removing tbody may resolve the problem.

I try with:

And still doesn't work... I do a little more research, and some people report they get their XPath removing the numbers, so I try this:

Still no luck...

So I decide to do it step by step like this:

I find the info I need in bbb, but not in ccc.

What am I doing wrong, or is there better tool to scrap HTML with long/complex XPath.

0 投票
7 回答
2619 浏览

ruby - hpricot中的分段错误

我正在使用 hpricot 来阅读 HTML。我遇到了一个分段错误错误,我用谷歌搜索,有人说升级到最新版本的 Ruby。我正在使用 rails 2.3.2 和 ruby​​ 1.8.7。如何解决此错误?

0 投票
0 回答
4393 浏览

php - php 有什么像 hpricot 或美丽的汤之类的吗?

可能的重复:
用于 PHP 的强大、成熟的 HTML 解析器

我正在寻找一种在 php 中解析和修改 html 文档服务器端的好方法。美丽的汤和 hpricot 看起来是非常好的工具,但它们不适用于 php。有没有什么好的库可以在 php 中做到这一点?整洁似乎部分是我正在寻找的,但看起来你不能在整洁中使用选择器等。

0 投票
1 回答
316 浏览

ruby-on-rails - 动作缓存不起作用

我在我的 rails 应用程序中从 twitter 和 flickr 获取和操作 XML。结果出现在每个页面上,解析在应用程序控制器中使用 Hpricot 和 open-uri 处理。

这是我对动作缓存的第一次实验,它似乎不起作用。我使用 WEBRick 处于开发模式。在 development.rb 中所有合适的东西都设置为 true。

这是控制器中的内容:

/tmp/cache 中没有显示任何内容,很明显 Hpricot 在每次页面加载时都在做这件事。

提前致谢。

0 投票
2 回答
987 浏览

ruby-on-rails - Hpricot 元素相交

我想从 HTML 页面(实际上是 tinymce 用户输入)中删除所有不符合特定标准(class = "int" 或 class = "ext")的图像,并且我正在努力使用正确的方法。这就是我目前正在做的事情:

但我不知道如何找到类具有错误值的图像(不是“int”或“ext”)。

我还必须遍历元素以检查不是标准 html 的其他属性(我使用它们来设置内部值,例如我在属性 dbsrc 中设置的 DB id)。我也可以访问这些属性吗?有没有办法在某些元素(在 hpricot 搜索结果中)不符合我的条件时删除它们?

谢谢你的帮助!