问题标签 [rexml]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
284 浏览

ruby - 如何让我的 rexml/nokogiri 脚本运行得更快

我有这个 ruby​​ 脚本,它收集 46344 个 xml 链接,然后在每个 xml 文件中收集 16 个元素节点。该过程的最后一部分是将其存储在 CSV 文件中。我的问题是它需要很长时间。需要1-2个小时以上。。

这是没有包含所有 XML 链接的链接的脚本,我无法提供链接,因为它的公司内容.. 我希望它很酷。

这是脚本,它可以工作,但需要很长时间:

0 投票
1 回答
229 浏览

ruby - 在 ruby​​ 中,如何删除非单词字符?

这个脚本是一个更大的脚本的一部分,当我运行这个脚本时,我也会得到“ <p></p>”打印出来。我怎样才能删除这个?

我使用了这个正则表达式: m.gsub!(/(?=\S)(\d|\W)/,"")

但它只删除了字符“<”和“/>”

这是我的脚本:

0 投票
1 回答
193 浏览

ruby - 如何在 ruby​​ 中更好地处理控制流和 nil 对象

我有这个脚本,它是一个更大的脚本的一部分。我有树不同的 XML 文件,看起来彼此之间有点不同,我需要某种类型的控制结构来更好地处理 nil-object 和 xpath 表达式

我现在拥有的脚本输出 nil 对象:

输出:

描述:bestrykning,kalandrering,tryckning,kemiteknik

描述:Vill du jobba med internationella och globala frågor med... 描述:全球化研究对于我们了解当今世界变得越来越重要,全球研究学院是一个独特的研究环境。

描述:

描述:

描述: Kursen behandlar identifieringen och beskrivningen av sjukliga förändringar i mänskliga skelett。Kursen ger en ämneshistorisk bakgrund och skelettförändringars förhållanden till moderna kliniska data diskuteras。

0 投票
3 回答
869 浏览

ruby - 如何正确爬行?

一个月以来,我一直在研究 Nokogiri、REXML 和 Ruby。我有这个巨大的数据库,我正在尝试爬取。我正在抓取的内容是 HTML 链接和 XML 文件。

我想要抓取并存储在 CSV 文件中的正是 43612 个 XML 文件。

如果抓取 500 个 xml 文件,我的脚本可以工作,但更大的文件需要太多时间并且它会冻结或其他东西。

我在这里将代码分成几部分,以便于阅读,整个脚本/代码在这里:https ://gist.github.com/1981074

我正在使用两个库,因为我找不到在 nokogiri 中完成这一切的方法。我个人觉得 REXML 更容易使用。

我的问题:如何解决它,这样我就不会在一周内爬完这一切?如何让它运行得更快?

这是我的脚本:

需要必要的库:

创建一堆数组来存储抓取数据:

从规范站点获取所有 xml 链接并将它们存储在一个名为 @urls 的数组中

循环抛出@urls 数组,并用xpath 抓取我想抓取的每个元素节点。

然后将它们存储在 CSV 文件中。

0 投票
1 回答
584 浏览

ruby-on-rails - REXML::Document.new 使用 US-ASCII 编码的 XML 解析失败

实际上,我在使用 Rails 3.2.1 的 jruby-1.6.7 中使用 REXML::Document 解析 XML 字符串时遇到了问题。

我有一个字符串

它曾经与 jruby-1.6.5.1 一起工作

截至目前,它失败了:

将标题更改为如下所示:

一切安好。我是否错过了系统上的库,这是一个已知问题吗?US-ASCII 无效吗?

0 投票
1 回答
130 浏览

rhomobile - Using Rexml to parse RSS feed but heavy data not loading on device in Rhomobile

I am using Rexml for reading the RSS feed and is working fine with small size of feed. The large size feed is not working on device although working fine on simulator. How can i handle large size data?

0 投票
1 回答
112 浏览

ruby - 新手 XML 解析

我正在学习使用 RUBY 进行 XML 解析(实际上之前从未做过任何 XML 解析)。请参考此链接 - http://www.tutorialspoint.com/ruby/ruby_xml_xslt.htm 在类似 DOM 的解析示例中,它打印所有电影标题,后跟电影类型。但我想打印 Title 和 type 作为一对,然后移动到下一个 xml 节点。

我怎样才能做到这一点?

0 投票
1 回答
1083 浏览

ruby - 使用 REXML 文档和 Ruby 获取元素的 InnerXML

我想遍了所有地方,但没有找到答案。

我正在使用一个 SOAP API,我希望只将数据库中的部分响应存储为 XML。

代码如下:

这为我提供了响应节点内的所有 XML。

我只想要那个节点的内容,而不是节点。

现在我得到:

但我只想要:

我正在使用带有 Rails 3.2.x 的 ruby​​ 1.9.3-head。

我在某处找到了一个 .value() 方法,但它不适用于元素,这是我从 XPath 搜索中得到的。

请指教。

0 投票
1 回答
975 浏览

ruby - XPath-REXML-Ruby:选择多个兄弟姐妹/祖先/后代

这是我在此的头一篇博文。我刚刚开始使用 Ruby,并且正在使用 REXML 进行一些 XML 处理。我在这里展示了我的 xml 文件的一个小样本:

我的目标是将标签中的最后一个数值与我从数组中获得的值列表相匹配。我通过以下代码片段实现了这一点:

获得了我希望调查的特定标识符,现在我想返回并选择然后选择以获取该特定标识符的节点中的值。

我还查看了该网站上的 XPath 教程和表达式以及许多相关问题,并了解了轴和不同的概念,例如祖先/跟随兄弟等。但是,我真的很困惑,无法轻易弄清楚这一点。

我想知道是否可以得到任何帮助,或者是否有人可以将我指向“易于”阅读的在线资源。

谢谢你。

更新:

我一直在尝试各种代码组合,例如:

代码编译但不输出任何内容。我想知道我做错了什么。

0 投票
3 回答
211 浏览

ruby-on-rails - rails 2.3.8 中的thinking-sphinx + REXML 错误

我正在尝试通过sphinx运行thinking-sphinx,一切正常,直到我进入搜索页面

我有以下型号

并在我的应用程序控制器中包含(经过一些网络搜索)

但是当我去学生控制器索引动作时

我收到以下错误

对正在发生的事情有任何想法吗?

我的环境如下

导轨 2.3.8

提前致谢