问题标签 [hpricot]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
559 浏览

ruby - 使用 hpricot 获取 href 属性的一部分

我想我需要 hpricot 和正则表达式的组合。我需要搜索具有以“abc/”开头的“href”属性的“a”标签,并返回其后的文本,直到下一个正斜杠“/”。

所以,给定:

我需要回来:“12345”和“67890”

任何人都可以伸出援助之手吗?我一直在为此苦苦挣扎。

0 投票
1 回答
367 浏览

ruby - Hpricot 解析图像替代文本

我正在尝试使用 Hpricot 从页面上的所有图像中提取替代文本,但不知道该怎么做。

有没有人这样做过?

谢谢!丹尼斯

0 投票
1 回答
888 浏览

ruby - 使用 Hpricot 获取子元素

如果我有以下包含子元素的元素,如何使用 Hpricot 访问这些子元素?

<p><b>Code</b> <i>base</i> is <a href="#">cool</a> stuff dude!</p>

0 投票
1 回答
1135 浏览

mysql - 在 Rails 中将 XML 文件数据填充到 db

为了处理一些客户端信息,我一直在用 hpricot 解析一个 3MB 的 XML 文件……但是 hpricot 需要相当长的时间来定期解析文件。

我正在考虑将这些数据填充到 MySql 数据库(每周一次),以便我可以直接在带有 Rails 的 mysql 上处理数据。

该文件基本上是一个 XML Google 联系人文件,其中包含客户信息:姓名、电子邮件、注释......但也有一些联系人包含多个值字段,例如地址、电话。

目前,当我解析数据时,我生成了一个 Contact 类

telephonesaddresses包含一个具有不同值的数组。

我想如果我想在 mysql 数据库中重新创建这个结构,我需要创建三个表:联系人、电话和地址......

您将如何将Contact class数据填充到数据库表中?有没有办法将数据直接从 XML 文件插入到数据库表中?

任何建议和指导将不胜感激:) 谢谢!

0 投票
1 回答
1450 浏览

ruby-on-rails - 如何从嵌入式视频中获取缩略图

我正在使用 Ruby on Rails 2.3.8 和 Hpricot 插件来解析 HTML。

我想获得嵌入式视频缩略图,并在互联网上搜索我发现 youtube 和 vimeo 至少使用 OG(开放图形)协议,该协议提供包含视频信息(url、缩略图等)的元标记。

例如,如果我有这个视频,我可以使用 Hpricot 插件阅读以下元标记:

因此,使用 Hpricot 我应该能够按如下方式解析它:

但我得到了一个空元素。

注意:如果您搜索video_page.search("//meta"),它会在列表中找到我想要的那个......但使用前面的语法它不会。

谁能告诉我如何解决这个问题?

0 投票
2 回答
999 浏览

ruby-on-rails - Windows 上的 Rails Bundler 拒绝安装 hpricot(即使在手动 gem install get Error: no such file to load -- hpricot)

在混合平台开发组中升级到 rails 3,并使用 Bundler for gems。我在 Windows 上。当我运行 Bundle Install 时,它成功完成,但不会安装 hpricot。hpricot线是:

也试过

两者都很好,但是当我尝试做一个“捆绑秀 hpricot”时,我得到:

如果我运行一个rails控制台并尝试“需要'hpricot'”,我会得到:

我也手动安装了 hpricot,但仍然出现上述错误。这在移动到 rails 3 之前运行良好。

0 投票
1 回答
719 浏览

ruby-on-rails - Rails 控制台-Hpricot,Nokogiri 在 Rails 控制台中不可用?

我一直无法找到以下解决方案:

在安装了诸如 hpricot 或 nokogiri 之类的 gem 之后,我无法在 rails 控制台中访问它们。这些宝石出现在我的宝石列表中,并且似乎与我的其他宝石具有相同的路径。

在控制台中,对于“标准”宝石,它们可以是必需的,例如:

但是,要求 nokogiri 会返回以下内容:

无论如何,我真的很感谢对我的新手问题的帮助,大部分时间都在努力解决这个问题。:)

0 投票
1 回答
142 浏览

ruby-on-rails - Ajax on Rails 的一些问题

我正在使用 Ruby on Rails 2.3.8。我有一个投票链接,当您单击它时,它会执行以下操作:

在 HTML 中,“d_voting_links_”类的 div 与 html 页面中显示的帖子一样多。

我不知道为什么,在我安装了 Paperclip、Rails TinyMCE 和 Hpricot 插件(它们都在最新版本上)之后,这些 ajax 请求停止工作(真的很疯狂)。

我没有改变我的任何代码,我什至检查了我以前的版本,它可以工作并且没有任何改变,但是那些插件。

我还尝试创建一个简单的 div 并从相同的操作中调用它,但它无法识别它(如果我从请求中删除“。”,它会识别它,但这会搜索 ID,我需要搜索上课)。

你知道这些插件和这个 ajax 语法之间的任何已知问题吗?或者也许......你知道问题可能是什么吗?

0 投票
2 回答
785 浏览

ruby-on-rails - 未关闭的 img 标签的问题

数据以 HTML 格式呈现并提交给服务器,服务器进行一些预处理。

它使用“img”标签的“src”属性进行操作。

预处理保存后,所有预处理的“img”标签都不会自闭。

例如,如果“img”标签如下:

用 Nokogiri 或 Hpricot 预处理后,它将是:

代码非常简单:

对于 Nokorigi,它看起来是一样的。

如何解决这个问题?


更新 1

忘了提 - 我有 HTML 5 页面,我正在尝试使用W3C Validator进行验证。

当“img”标签在 div 中时,它会抱怨以下内容:

例如,尝试验证以下代码:

你会得到同样的错误:

0 投票
1 回答
1100 浏览

ruby-on-rails - 以编程方式从 html 中删除图像和视频

我正在开发 Ruby on Rails 2.3.8,并且我有一个网站,用户可以在其中输入帖子。他们每个人都有一个简短的描述,显示在主页上。该描述是从原始内容自动构建的,但只是被截断,因此最多可以达到 240 个字符。

问题是那些描述可能包含图像或视频,我不希望它们在我截断这些字符串时出现。我正在使用Hpricot插件来解析 HTML,并使用以下正则表达式来解析图像:

这是删除图像,但有时它会留下一个字符串,例如它在图像之前的位置显示“image”或“img”。现在,例如,在我从描述中删除图像后,我看到剩余的松散“垃圾邮件”文本。也许正则表达式不正确。

有谁知道哪个是删除图像的正确正则表达式,还有来自 html 的视频?