问题标签 [nokogiri]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
5279 浏览

xml - Nokogiri 节点删除后删除空行的更好方法

也许这很挑剔,但我不得不问。

我正在使用 Nokogiri 解析 XML,删除某些标签,并用结果覆盖原始文件。使用.remove会在 XML 中留下空白行。我目前正在使用正则表达式来摆脱空白行。我应该使用一些内置的 Nokogiri 方法吗?

这是我所拥有的:

0 投票
1 回答
1148 浏览

html - nokogiri:xml 到 html

我只想做一些直接的转换(几乎只是搜索和替换),但我无法将东西放在适当的位置 - 我最终会出现不合适的链接和重复的内容。我确定我在尝试遍历 xml 时做了一些愚蠢的事情:)

我正在尝试:

上:

去创造:

我一直在尝试各种各样的事情来尝试让它工作,基本的 html 结构还可以,但是段落的孩子是一团糟 - 任何帮助都会非常感激。问候,里奇

0 投票
3 回答
479 浏览

ruby - ruby 脚本内存消耗百分比不断上升......有什么办法可以防止这种情况发生吗?

当我运行我的 ruby​​ 脚本时,这是一个很长的循环系列。对于每个循环,通过 nokogiri 解析一些随机的 html 文件。

top 显示内存消耗百分比随着 CPU 使用率每隔几秒增加 0.1。

最终,ruby 脚本由于“内存不足”而崩溃

更新到最新:

0 投票
1 回答
165 浏览

ruby - nokogiri:无效的xpath?

这将不起作用,并抱怨无效的 xpath。

但是,复制粘贴输出字符串

将毫无问题地工作!!!

这里发生了什么?

0 投票
1 回答
667 浏览

ruby - nokogiri doc.xpath() 问题

当循环浏览许多网页并调用如下简单的东西时

我观察到内存消耗不断增加,直到脚本因内存不足而终止。

当我删除 doc.xpath 位时,没有遇到上述错误。

0 投票
2 回答
609 浏览

ruby - running nokogiri in Jruby vs. just ruby

I found startling difference in CPU and memory consumption usage. It seems garbage collection is not happening when i run the following nokogiri script

when run in Jruby, CPU consumption is over 10, and memory consumption % rises with time(starts from 2 to 20), until it eventually says "not enough memory"

when run in Ruby, CPU consumption never exceeds 2, and memory consumption % constant at 0.2 !

Why such big differences, why is memory consumption steadily increasing until it crashes.

running it in Ruby, much much lower cpu usage, and constant very low memory consumption

0 投票
2 回答
2606 浏览

html - 如何使用 Nokogiri::XML::Builder 向 HTML 添加非转义 & 符号

我想使用 Nokogiri 中的 XML Builder 向 HTML 添加项目符号“•”之类的内容,但所有内容都被转义了。如何防止它被逃脱?

我希望结果是:

而不是:

我只是这样做:

我错过了什么?

0 投票
4 回答
3012 浏览

ruby - 可以在不安装 nokogiri-java 的情况下在 jruby 中加载 nokogiri 吗?

我需要一种方法来运行以下 nokogiri 脚本

并在 jruby 中调用parseit()main.rb 下面运行的 while

当然问题是 jruby 找不到'nokogiri',因为我还没有安装它 aka nokogiri-java viajruby -S gem install nokogiri

原因是我在 Jruby 下运行的 nokogiri 中发现了一些错误,所以我只在 Ruby 上安装了 nokogiri 而不是 Jruby。parser.rb仅在 Ruby 下完美运行。

所以我的目标是能够运行 parseit() 而无需在 Jruby 上安装 nokogiri!

0 投票
1 回答
482 浏览

ruby - 在 Ruby 中打印 XML 节点的 XPath 的最快/单线方法?

在带有 Nokogiri 的 Ruby 中打印当前节点 xpath 或只是“path/to/node”的最快/单线方法是什么?

所以这:

p>

对此(假设我们已经通过处理 xml.children.each 等进入 nodeC ......):

0 投票
3 回答
6854 浏览

xml - 如何使用 Nokogiri Builder 创建具有命名空间根元素的 XML 文档

我正在为需要命名空间的 XML 数据实现导出器。我正在使用 Nokogiri 的 XML Builder(版本 1.4.0)来执行此操作,但是,我无法让 Nokogiri 创建具有命名空间的根节点。

这有效:

就像这样:

但是,我需要类似的东西<foo:root>,但这不起作用:

显然,命名空间必须在使用前定义,因此无法将一个添加到根节点。

我在 Nokogiri 邮件列表中找到了“ Define root node with a namespace? ”,但没有回复。

有没有人有办法解决吗?