问题标签 [nokogiri]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1109 浏览

xml - 如何让 nokogiri 选择节点属性并将它们添加到其他节点?

是否可以像这样获取以下元素的属性并在前面的元素中使用它们?:

进入:

我有类似的东西,但得到节点集或字符串错误:

0 投票
1 回答
2423 浏览

ruby - Nokogiri 如何获取父文本而不是子文本并将文本引用回其父文本

假设我有这个样本:

结果将n.texthello peoplehello world,我想以某种方式做到这一点,以便我可以获得父文本及其子文本,但将它们与它们的标签相关联

所以结果会是这样的

0 投票
1 回答
709 浏览

ruby - Nokogiri 和随机 div 名称

使用 Nokogiri 和 Ruby。

我有一个用 div id 解析的页面,例如:

div id="some-list-number^875"

...-number^ 之后的数字随机变化,我就是做不到

但是基本结构总是相同的-number^..一些数字......

所以我需要一些用于这些数字的通配符。

我该如何使用 ruby​​ 和 Nokogiri 来处理这个问题?

谢谢!

0 投票
3 回答
177 浏览

ruby - 在 xhtml 文档中查找特定单词的最快方法

最快的方法是什么。

我可能有可能(或可能不)包含“说明”一词的 html 文档,后跟几行说明。我想解析这些包含“说明”一词和后面几行的页面。

0 投票
8 回答
29601 浏览

html - 如何使用 Nokogiri 漂亮地打印 HTML?

我用 Ruby 编写了一个网络爬虫,我正在使用Nokogiri::HTML它来解析页面。我需要将页面打印出来,在 IRB 中搞乱时我注意到了一种pretty_print方法。但是它需要一个参数,我无法弄清楚它想要什么。

我的爬虫正在缓存网页的 HTML 并将其写入本地计算机上的文件。我想“漂亮地打印”HTML,这样当我这样做时它看起来不错并且格式正确。

0 投票
1 回答
931 浏览

ruby - nokogiri 与 :after CSS 选择器

我有以下html:

我想在span标签之后废弃文本,即“公司”

所以,当我尝试

没有方法错误 :after 被抛出。如何在 Nokogiri 中使用伪选择器?

0 投票
1 回答
330 浏览

ruby - 给定正确的 xpath,nokogiri 返回空白

运行以下命令,它应该返回公司名称。xpath 在 Firefox 中工作,它返回公司名称。但是在 nokogiri 中,这并没有发生,它只是返回空字符串!

0 投票
3 回答
18009 浏览

xml - 如何使用 Nokogiri::XML::Builder 在元素名称中带有连字符来创建 XML?

我正在尝试使用 Nokogiri 构建 XML 文档。一些元素中有连字符。这是一个例子:

产生:

但是,当我尝试:

我得到:

现在我意识到这是因为连字符被解释为foo MINUS bar.

我该怎么做?

0 投票
5 回答
2734 浏览

xml - 使用 nokogiri builder 添加 dtd

nokogiri用来生成 svg 图片。我想添加正确的 xml 序言和 svg DTD 声明以获得类似:

builder我可以使用,instruct!declare!我想坚持使用,nokogiri因为我在项目中将它用于其他目的,并且我希望保持低要求。你有什么想法吗?

谢谢

0 投票
1 回答
2613 浏览

html - 删除